iwiwi 備忘録

学んだことを殴り書きます。自分向けのメモです。

2013-01-01から1年間の記事一覧

Finding the k Shortest Paths (SICOMP'98)

s, t が与えられるので,k 本の最短路を計算する O(m + n log n + k) でできるよっていう論文 キーとなるアイディア t からの逆最短路木を T とする 例によって,ポテンシャルを使って辺の重みを変換する.T に含まれる辺の重みは 0 になる. パス p は,T …

Applied Numerical Linear Algebra

01. Introduction $x = Ab$ を解きましょう. 直接法は疎でも $O(n^2)$ はかかってしまうので,反復法が良さそう $k$ 回目の反復で得られた解を $x^k$,残差を $r^k = b - Ax^k$ とおく Jacobi 法,Gauss-Seidel 法 02. Krylov Subspaces and Arnoldi Iterat…

Spreadsheet Data Manipulation Using Examples (CACM'12)

問題設定 Excel とか.ユーザはプログラミングができないが,テーブルに対する作業を自動化したい. 例えば,いろんなフォーマットで書かれた電話番号たちを,統一したフォーマットに直す. 小数の例から,作業をプログラムとして学習し,自動化できないか?…

Flows (Grpah Theory, Chapter 6)

辺を2方向の向きで区別するため,e=xy の時,f(e, x, y) と f(e, y, x) という書き方をする Circulations circulation:f(e, x, y) = -f(e, y, x) で f(v, V) = 0 bridge なら流量 0 Flows in networks network:グラフ+capacity function, flow:始点終点 …

Coloring (Graph Theory, Chapter 5)

-vertex coloring, chromatic number $\chi(G)$ edge coloring, chromatic index (=edge chromatic number) $\chi'(G)$ $χ'(G)$ は $\Delta(G)$ or $\Delta(G) + 1$ Coloring maps and planar graphs 4 色定理(5 色なら証明簡単) triangle-free -> 3-colo…

Connectivity (Graph Theory, Chapter 3)

vertex connectivity, edge connectivity cut vertex (=articulation point), bridge block (= maximal 2-connected subgraphs) 2-connected 任意の 2-connected graph はパスの付加を繰り返すことで構成できる 3-connected 3-connected で |V|>4 なら,ある…

Matching, Covering and Packing (Graph Theory, Chapter 2)

k-factor = 全域部分グラフであって,全頂点の次数が k 2 部グラフのマッチング 2 部マッチングのサイズ = 頂点被覆のサイズ $|N(S)| \geq |S|$ for all $S \subseteq A$ stable matching は常に存在 一般グラフのマッチング G が 1-factor 持つ ⇔ $q(G-S) …

First Passage Time for Random Walks in Heterogeneous Networks (PRL'12)

概要 スケールフリーネットワーク上のランダムウォーク ある次数 k への到達のしやすさを 3 パターンに分ける 用語&既存の結果 スペクトル次元 スペクトル次元 d_s は ρ(λ) 〜 λ^{d_s / 2 - 1} ρ(λ) は固有値の分布(確率密度関数) RTO (return to the ori…

Online Search of Overlapping Communities (SIGMOD'13)

問題 頂点 v, k が与えられるので,v を含む k-clique percolation (的なもの) を即返す 前処理なし (この問題を考えたこと自体が貢献) 拡張した k-clique percolation (α, γ)-OCS: γ-quasi k-clique,α頂点共有なら枝を張る アルゴリズム 普通に探索する …

Efficient Ad-hoc Search for Personalized PageRank (SIGMOD'13)

問題 PPR の top-k を前処理なしで高速に求める similarity は求めない,top-k の順序を exact に求める 提案手法 (Castanet) 4.2 Similarity estimation 長さ i の RW (jump なし) での分布 R_i[u] から lower bound と upper bound が得られる 4.3 Subgrap…

Efficient Personalized PageRank with Accuracy Assurance (KDD'12)

問題 p2p PPR top-k PPR threshold PPR (しきい値以上を取得) 提案手法 3.2.1 行列. s = c{I-(1-c)A}^{-1} d なので,I-(1-c)A を QR 分解する クエリは,cR^(-1) の v 行と Q^T d の内積 cR^(-1) と Q^T を覚えておくっぽい 3.2.2 Q, R をスパースにする…

Quick Detection of Top-k Personalized PageRank Lists (WAW'11)

問題 PPR と言いつつ RWR 手法 アルゴリズム 1 MC End Point ランダムウォークを始点から実際にやりまくります 終点の至った分布を RWR アルゴリズム 2 MC Complete Path ランダムウォークを始点から実際にやりまくります 終点だけじゃなくて,途中でも,通…

Massive Graph Triangulation (SIGMOD'13)

問題:三角形を全列挙 M: size of memory, B: size of disk block, K: #triangles 既存手法 em-cf, em-ni, graph partition [james cheng] 提案手法:MGT 次数が小さいグラフに変換 次数が cM/2 より大きい頂点を発見 次数の大きさで順番づけ,DAG になる cM…

Network link prediction by global silencing of indirect correlations (Nature Biotechnology 2013)

問題 頂点間でどのぐらい相関があるかだけわかってて,グラフを復元する? 手法 saliencing transformation S_{ij} global response matrix G, local response matrix S S_{ij} を愚直に求めるのは O(n^2) の連立方程式なので NG 対角項を近似して,G_{ii}=1…

Piggybacking on Social Networks (VLDB'13)

ツイッターみたいな購読ベースの SNS サービス 問題 有向グラフ=購読関係,u->v := uの情報をvが購読 クエリ:Produce (発信),Consume (最新情報取得) push edge と pull edge を決めておく push edge: 始点で produce が起きた瞬間,新データを全部伝搬 p…

Spectral Analysis of Communication Networks Using Dirichlet Eigenvalues (WWW'13)

主張 無限グラフの固有値に比べて,切り取ってできた有限グラフの固有値はよくない 境界を考慮して "Dirichlet 固有値" を使うことを提案 例 有限の木と無限の木は,全然違う 複雑ネットワークの構造 core-whisker 各ペアに流量 1 のフローを流すと,O(n^2) …

Dynamic social networks promote cooperation in experiments with humans (PNAS'11)

背景 「協力」という行動について.協力=コストを払って他者に資源を与える行動 進化ゲーム理論.非協力行動より協力行動のほうが有利になるような原理を説明したい(むずい) 静的なネットワークでなく,動的なネットワークと思うと……? 実験概要 N 人囚人…

malloc の旅 (glibc 編)

malloc の動画 http://www.youtube.com/watch?v=0-vWT-t0UHg http://www.slideshare.net/kosaki55tea/glibc-malloc http://togetter.com/li/574262 すごい分かりやすかった K&R Malloc (first fit) 次の空き領域へのポインタを空き領域の先頭に置いておく fr…

高速入出力

ifstream で読むより4倍ぐらい速い感じ inline bool readeof(FILE *fp) { for (;;) { int c = getc(fp); if (c == EOF) { return true; } else if (isspace(c)) { continue; } else { ungetc(c, fp); return false; } } } inline int readint(FILE *fp) { i…

BDD, ZDD, フロンティア法, Graphillion

詳しい資料へのポインタを示しつつ,自分が読んで理解した範囲の簡潔なまとめを書きます. BDD 入門 湊先生の授業が詳しく分かりやすい. http://www-alg.ist.hokudai.ac.jp/~minato/alg2013.html 概念自体 図を一個見れば一発で理解できる DAG で,各中間ノ…

2-hop index のラベルサイズの下界

http://research.microsoft.com/en-us/people/goldberg/hl.pdfLabel Sizes一般の場合:$\Omega^*(n)$[Gavoille et al. 01]

KDD 2013

Research Session 3: Big data frameworks #52 TurboGraph: A Fast Parallel Graph Engine Handling Billion-scale Graphs in a Single PC Research Session 4: Graph mining #583 Denser than the densest subgraph: extracting optimal quasi-cliques with…

IRIE: Scalable and Robust Influence Maximization in Social Networks (ICDM'12)

モデル:Independent Cascade Model アルゴリズム IR 適当なDP的なのだと重複して数えてしまうけど,適当に定数をかけて調整して,見積もろう アルゴリズム IRIE かぶったところを選んでしまうのを防ごう 頂点vが,既に選んだSにより勝手にactivateされる確…

The organization of strong links in complex networks (Nature Physics 2012)

クラスター性,common neighbor の数 2 種類のネットワーク! integrative networks: 重みが大きい → common neighbor が多い dispersive networks: 重みが大きくても common neighbor 多いとは限らない link clustering coefficient C_L = n_c / n_t excess…

Efficient Network Reconstruction from Dynamical Cascades Identifies Small-World Topology of Neuronal Avalanches (PLoS Comput. Biol. 2009)

イベントの発生だけを観測できる.流れのグラフ構造を推定したい. 手法の提案,検証,実データ(神経データ)への適用 手法 最初のシードは 1 点 1 つ前のタイムステップでのイベントのみが次のステップに影響 ベイズの法則.推定パラメータ p_{ij} (ノード…

Emergence of hierarchy in cost-driven growth of spatial networks (PNAS'13)

spatial network のモデル ただし,木 モデル コスト N ノードが [0,L)*[0,L) 上にランダムに分布,1 つの頂点を根に選ぶ 各タイムステップ,木が 1 つずつ大きくなる 孤立点を,earning R が最大となる相手と接続する R_ij = B_ij - C_ij Expected traffic …

Streaming Graph Partitioning for Large Distributed Graphs (KDD'12)

問題 複数台でグラフを分割して格納・処理 どのようにグラフを分割するか 頂点集合を分ける,サイズは |V|/K の (1+ε) 倍まで OK またがる辺の本数を最小化 ストリーミング;v が1つず渡されるので,その近傍の情報から答える ヒューリスティクス balanced:…

GNU Parallel

超簡単にファイルを並列で処理できる. ls archive/*.bz2 | parallel -j+0 "bzcat {} | ruby hoge.rb > out/{/.}.tsv" {} でファイル名,{/.} でファイル名のディレクトリ名とパスを取り除いた部分

Modeling Urban Street Patterns (PRL'08)

交通ネットワークのモデル,数値シミュレーション 現実の道路ネットワークの特徴 リンク数とノード数:E ~ 1.44N リンクの長さの総和 vs ノード数:√n に比例 (実験がちょっと怪しい) セル面積:べき分布 セルの形状の非一様性:幅広い分布 モデル:成長ネ…

Ubuntu 12.04 on X1 Carbon

ターミナルで Alt+B, Alt+F が使えるように http://askubuntu.com/questions/140209/how-to-get-altb-and-altl-to-work-in-the-terminal Open the terminal window, go to "edit->keyboard shortcuts" and unselect the first check box "Enable menu access…