Ubuntu 14.04 上で Eclipse CDT 日本語化 + ランチャー登録
http://ubuntu.hatenablog.jp/entry/20140528/1401270897
上に加えて以下を行わないと起動しなかった.
eclipse.ini 末尾に追記
- Xverify:none
Ubuntu 14.04 + TeXlipse で快適な日本語原稿執筆
求めた条件は以下.
- 日本語がビューワでもちゃんと表示される
- SyncTeX がちゃんと動く
結論から言うと,以下を設定すると上手く行った.
- ビューワには pdf4eclipse
- ビルダーには pdflatex
- フォントを全て埋め込む (dvipdfmx に -f ptex-ipa.map)
- \documentclass{scrartcl} \usepackage[whole]{bxcjkjatype} (LaTeX-CJK - TeX Wiki)
TeXlipse の設定は以下のサイトがかなり有用.
普通に設定すると,英語のみではすぐに快適に動く.しかし,日本語が表示されず,その症状と戦うことになった.以下は,試行錯誤のログ.
違うビューワを用いる方針
SyncTeX の連携を活用してみたかったので,TeXlipse との連携が必要.
デフォルトで日本語が表示できないのは,ビューワとして pdf4eclipse が用いられるためである.したがって evince なんかをビューワとして用いれば良いように思う.
しかしこの設定が上手く行かない.また,pdf4eclipse はフォントが埋め込まれていれば日本語も正しく表示できるらしい.どうせなら生成する PDF にはフォントを埋め込んだほうが良さそうなので,PDF にフォントを埋め込む方針にする.
uplatex + dvipdfmx, platex + dvipdfmx
pdflatex は日本語がサポートされていないと記憶していたし,ちょっと試してみたらやっぱりコンパイルできなかったので,(u)platex をまずは試す.
フォントを埋め込むことは頑張るとできた.いくつか情報があるが,上手く行かないものと上手く行ったものがある(あるいは両方が必要だったのかもしれない).
この方法でフォントを埋め込むと,pdf4eclipse で確かに日本語が表示された.めでたしめでたし……と思いきや,この方法で生成された PDF では,SyncTeX で位置が大幅にズレるということに気づいた.がっかりである.どうやら,そもそも日本語を含めなくてもズレてしまう.
白い巨塔で学ぶ教授職
ドラマ「白い巨塔」を見ました.前半は主人公である財前助教授が教授選で戦い教授になるまでの物語です.教授という職がいかに素晴らしいものであるか,そして教授になるのがどれほど難しいことかといったことが描かれています.医学部(大学病院)の話ではありますが,我々にも通じるところがあるはずです.
3 話
(財前助教授の説明を受けて)
東教授「君,言葉を慎みたまえ!君にそのような講義を聞かなくてもわかっているよ.それとも,既に教授にでもなったつもりかね?」
教授は学問を究めし者である.当然全てをご存知である.出しゃばった説明は失礼である.
5 話
東教授「今のはなんだね?」
財前助教授「新人局員の柳原であります.」
東教授「君が言わせたのかね?」
……
東教授「一介の医局員が教授に意見を言うのは百年早いよ.」
ましてや医局員(≒博士課程学生)が教授に意見を述べるというのは到底あり得ないことである.
5 話
鵜飼教授「里見君,君は志のある良い医者だが,僕の方針に従えないのなら,第一内科を出て行ってもらうしかないね.忘れちゃいけないよ?僕は教授で,君は助教授なんだよ.」
常に立場を忘れてはならない.研究室に所属する以上,教授の方針は絶対である.
7 話
里見助教授「どうしてお前はそんなに教授になりたいんだ?」
財前教授「なんでかなあ.」
里見助教授「お前は医者として確かな腕を持ってる,たくさんの患者を救ってきた,それじゃだめなのか?」
財前教授「いくら命を救っても,教授になれなきゃ意味無いね.俺は偉くなりたいんだよ!一番になって,より多くの人間を従えて歩きたい.男なら誰でも思うことじゃないのか?」
里見助教授「少なくとも俺は思わんがね.」
財前教授「本当かね,自信が無いだけじゃないのかね?」
男なら誰でも教授になりより多くの人間を従えて歩きたいのである.そう思わない者は自信がないだけである.
10 話
財前教授「里見くん,僕に意見をするのは最後にしてくれないか?年を開けたら僕は教授に就任する.一助教授の意見にいちいち耳を傾けてはいられないからな.」
教授に就任すれば,例え同期であれ,当然,一助教授の意見にはいちいち耳を傾けていられなくなる.
真面目に身にしみたセリフのメモ
……ここまでの記事はもちろんジョークです.とにかく権力を急ぐ財前は,最終的に医療ミスによる裁判に負ける上,病気で早死にしてしまいます.幸せとは思えません.一方,誠実な仕事を貫く里見は,私立の病院に飛ばされてはしまうものの,幸せそうに暮らします.そういった物語だと言ってしまえばそれまでですが,なんとなく身近な話のようにも感じます.
7 話
里見助教授「教授になるのは目的じゃなくて結果だからな.」
子供「ねえ,お父さんはいつ教授になるの?お父さんも偉い教授になるんでしょ?」
里見助教授「教授だからって偉いわけじゃないんだ.教授でも,教授じゃなくても,自分の仕事をしっかりやる人はみんな偉いんだ.」
ACM Paris Kanellakis Award (Theory and Practice Award)
Paris Kanellakis Theory and Practice Award はコンピュータの世界に重要な実用的インパクトを引き起こした理論的研究成果に対して贈られる賞だそうです.賞金は $10,000.
Paris Kanellakis 氏はデータベース分野の研究者でしたが,1995 年に飛行機事故に巻き込まれ亡くなったそうです.賞金にはご両親からの寄付に加え ACM の分科会などからの支援が含まれているそうです.
- Paris Kanellakis Theory and Practice Award - ACM Award
- Paris Kanellakis Award - Wikipedia, the free encyclopedia
以下は受賞者と受賞の対象となった成果の表です.上記の Wikipedia 英語版の記事に記載されている表の日本語版……のつもりでしたが,Wikipedia にはよくわからない説明が多くても試しに公式ウェブページの説明を開くとよく知っているキーワードが出てきたりということも多く,そこそこの部分は結局公式ウェブページの説明に基づいています.
年 | 受賞者 | 受賞の対象となった研究成果 |
---|---|---|
1996 | Leonard Adleman, Whitfield Diffie, Martin Hellman, Ralph Merkle, Ronald Rivest, and Adi Shamir | 公開鍵暗号 |
1997 | Abraham Lempel and Jacob Ziv | データ圧縮(LZ アルゴリズム) |
1998 | Randal Bryant, Edmund M. Clarke, E. Allen Emerson, and Kenneth L. McMillan | 記号モデル検査と BDD |
1999 | Daniel Sleator and Robert Tarjan | スプレー木 |
2000 | Narendra Karmarkar | 内点法 |
2001 | Eugene Myers | シーケンスアラインメントアルゴリズム(BLAST) |
2002 | Peter Franaszek | Constrained Channel Coding |
2003 | Gary Miller, Michael Rabin, Robert Solovay, and Volker Strassen | 素数判定アルゴリズム(Miller-Rabin,Solovay-Strassen) |
2004 | Yoav Freund and Robert Schapire | ブースティング(機械学習) |
2005 | Gerard Holzmann, Robert Kurshan, Moshe Vardi, and Pierre Wolper | 形式的検証システム(COSPAN,SPIN) |
2006 | Robert Brayton | 回路設計のための論理合成 |
2007 | Bruno Buchberger | グレブナー基底 |
2008 | Corinna Cortes and Vladimir Vapnik | SVM (Support Vector Machine) |
2009 | Mihir Bellare and Phillip Rogaway | Practice-Oriented, Provable-Security (POPS) |
2010 | Kurt Mehlhorn | Library of Efficient Data types and Algorithms (LEDA) |
2011 | Hanan Samet | 4 分木等の多次元データに対するデータ構造 |
2012 | Andrei Broder, Moses S Charikar and Piotr Indyk | LSH (Locality-Sensitive Hashing) |
2013 | Robert D. Blumofe, and Charles E. Leiserson | 並列プログラミング(Cilk 等) |
回路・ハードウェア寄りの分野は不得手なので不正確かもしれません.より適切な日本語訳などもし有れば教えて頂ければと思います.
Core Decomposition of Uncertain Graphs (KDD'14)
定義
- uncertain graph
- 各辺に対し存在する確率が与えられる
- リンク予測の出力,影響,protein-interaction (ノイズ)
- (k, η)-core
- 極大部分グラフ H, [deg_H(v) ≧ k] ≧ η
計算
- 小さい方から剥ぎ取る
- 確率の計算がちょっと入るが簡単な DP
応用実験
- 影響最大化:密グラフとして抽出する前処理
- Task-Driven Team Formulation:それっぽいチームを探す
ダメな統計学
http://id.fnshr.info/2014/12/17/stats-done-wrong-toc/
知っている部分もあったが面白かった
- (1) はじめに
- 統計的処理がきちんと行われず誤った結論が導きだされている論文は半数以上かもしれないらしい(医学の話)
- (2) データ分析入門
- (3) 検定力と検定力の足りない検定
- (4) 擬似反復:データを賢く選べ
- 100 人で 10 回計測 → 1000 のデータ点?ではない
- 「擬似反復」と呼ばれる
- 対策法
- 独立していないデータ点の平均をとる
- 独立していないデータ点を別個に分析 → 多重比較
- 階層モデル
- (5) p値と基準率の誤り
- 「基準率」 = 調査対象のもののうち,真に有効であるものの割合
- p = 0.05 で判定を行うと,5% は擬陽性になる
- 真に陽性である確率(=基準率)と併せて考えないと結果が殆ど擬陽性になる
- p < 0.05 ≠ 「これの結果が偶然の確率は 5% だ」 (よくある勘違い)
- 偽発見率を制御する方法:ベンジャミーニ=ホッホベルク法
- (6)有意であるかないかの違いが有意差でない場合
- (7) 停止規則と平均への回帰
- 停止規則 = 有意差が出たら実験を止める
- しばしば結果が実際より誇張される
- サイズの違う集合での平均点の「上位」「下位」は両方小さい集合になる(ばらつくから)
- 停止規則 = 有意差が出たら実験を止める
- (8) 研究者の自由:好ましい雰囲気?
- 統計処理の際,無視して良い要素,除外する outlier 等で結果が大きく好ましい方向にねじ曲げられる
- (9) 誰もが間違える
- データを公開してほしい
- (10) データを隠すこと
- データを要求して送ってくる著者グループは 3/4
- データを得られた研究の半分がデータの処理に誤りがあった
- 15% では誤りによって有意な結果が出てしまっていた
- データを共有したがらないグループの方が誤りが多い
- マイナーな論文誌のほうがデータ処理法を隠す
ここから後は技術的な話ではなく教育等についての議論
次に誰かが「この結果は p<0.05で有意だから、これが偶然である確率は20分の1しかない!」と言うのを聞くことがあったら、私のためにその連中の頭を統計の教科書でぶったたいでください
高画質動画配信の方法
最近,やはり動画配信の時代だなと思う.どうせなら高画質で配信をしたい.その方法を調べる.
前提:Web カメラは NG
Logicool C920(t) は Web カメラとしては評判が良い.これは俺も持っているし,ICPC 放送の時とかはチョクダイもこれを持ってくる.定番のようだ.
まーしかし,やっぱりサイズもサイズだし画質はお遊びレベル感が否めない.特に,今年の ICPC 配信はカーテンを閉めた暗めの部屋だったからか,結構辛かった様子.
もっとデカいカメラは直接 PC につながるのか?
繋がらないようだ.
ここで,もっとデカいカメラはデジタル一眼レフとかデジタルビデオカメラを想定.USB に繋いでそのまま配信〜という用途で使えるものは今の所ない様子.
「HDMI スルー出力」
動画配信用途でそういったカメラを使う際のキーワードは「HDMI スルー出力」というものらしい.この機能を用いて,カメラから映像をそのまま HDMI で出力し,それを PC に取り込む.
HDMI スルーはできる機種は結構限られているらしい.メーカーのウェブページを見てもよくわからないので,口コミを探すしかない.
俺の E-M5 はできない.パナソニックの GH シリーズができるらしく,GH-2 時代から高画質配信界隈で好評らしい.α7 もできるらしい.
ちなみに
高画質配信を目指す界隈は「シネ UST」なんて呼ばれているらしい.
https://www.facebook.com/cineust
latex 執筆時に omake -P で快適自動ビルド
博論執筆の現実逃避で自分の latex 執筆環境の改善を少し試みる.
eps → pdf
eps の図を入れまくると tex のコンパイルが遅くなり omake -P の快適さが薄れてしまう.tex からは pdf を入れるようにして,omake で事前に eps を pdf に変換するようにした.
OMakefile
問題は,自分の画像のディレクトリ構造が上の OMakefile で想定されているものよりももっと深いこと.これに対応するのが簡単かと思いきや omake 初体験にはかなり骨が折れた.
omake はドヤ顔で「omake のルールには有効範囲のスコープがあるので管理しやすい!ワイルドカードを用いるルールが適用されるのはカレントディレクトリだけだ!」って言っているのだけれど,それがめっちゃ困るっていう.export というものを使うと変数等をグローバル化したりできるっぽいのだが,ワイルドカードのルールは頑張っても外に出てくれず,自分のググり力で30分ググった感じでは出すのに成功してる人は見つけられなかった.
というわけで愚直に foreach する以下のような物を書いたら動いた.
EPS_IMAGE_FILES = $(glob $(IMAGE_DIR)/*.eps $(IMAGE_DIR)/*/*.eps $(IMAGE_DIR)/*/*/*.eps) foreach(EPS_FILE, $(EPS_IMAGE_FILES)) PDF_FILE = $(addsuffix .pdf, $(removesuffix $(EPS_FILE))) XBB_FILE = $(addsuffix .xbb, $(removesuffix $(EPS_FILE))) $(PDF_FILE): $(EPS_FILE) $(EPSTOPDF) $< $(XBB_FILE): $(PDF_FILE) $(EBB) $<
no BoundingBox
上記のように Bounding Box を用意してやっても no BoundingBox と言われることがある.調べると,ファイルパスにドットが2つ以上入っていると起こる有名なバグみたいだ.これはひどい.
結果
EPS 使用時
omake thesis.pdf 10.17s user 0.61s system 100% cpu 10.740 total
PDF 使用時
omake thesis.pdf 0.89s user 0.09s system 99% cpu 0.977 total
満足.
発表中に画面にニコ動風にコメントを流したい
2つソフトが見つかった.どっちもすぐにマトモに動作した.
Querying K-Truss Community in Large and Dynamic Graph (SIGMOD'14)
- 問題
- グラフ G,クエリ:頂点 v, 整数 k
- v を含む k-truss community をすべて列挙
- k-truss vs. clique percolation
- clique percolation: コミュニティと呼べない,パラメータが3つも,NP-Hard
- k-truss: コミュニティの直径が |C|/k,高枝連結度,パラメタ1つ,多項式時間
- index
- dynamic update
- 下界だか上界だかを使って処理を枝刈りするらしい
Reverse Top-k Search using Random Walk with Restart (VLDB'14)
- RWR
- Bookmark Coloring Algorithm (BCA)
- 受け取って少し確定して残りを配るタイプのやつ
- ハブを活用
- ハブの頂点は受け取っても配らないことにして,後でまとめて影響を計算
- Bookmark Coloring Algorithm (BCA)
- Reverse Top-K RWR Query
- 頂点 q と k → 頂点 u からのの RWR で q が top-k に入る u を全て答える
- 応用:「こいつに強い影響を与えている物の集合」が得られる
- spam detection
- popularity of authors in co-authorship network
- promotion in co-purchase graph
- Offline indexing
- 各頂点から BCA を t ステップ走らせる → RWR の下界
- 改良:ハブ,サイズ圧縮,・・s
- Online Query Algorithm
- proximity の上界と下界を狭めていくよくあるタイプ
- 実験結果
- web-Google で前処理時間 10^6 秒とは・・・
- 応用実験 (5.4)
- spam detection, co-author network を試している
国内学会の全国大会の大まかな日程
後輩が国内イベント(全国大会)に行ってみたいと言っていたので調べてリストアップしてみる.日程は目安として前回のもの.
- DEIM(データ工学と情報マネジメントに関するフォーラム(日本データベース学会年次大会))
- http://db-event.jpn.org/deim2015/
- 申込 12/19,論文 1/9,発表 3/2-4(郡山)
- JSAI(人工知能学会全国大会)
- http://www.ai-gakkai.or.jp/jsai2015/
- 申込 1/16,論文 3/24,発表 5/30-6/2(函館)
- 日本オペレーションズ・リサーチ学会 春季研究発表会(秋季もある)
- http://www.orsj.or.jp/2015spring/
- 申込・論文 1/7, 発表 3/26-27(東京)
- 全国処理学会全国大会
- http://www.ipsj.or.jp/event/taikai/77/
- 申込 11/21,論文 1/9,発表 3/17-19(京都)
- (山下記念賞を頂いているので参加する)
他に関連が有りそうなものがあれば教えて下さい.
Path Skyline の計算サーベイ
厳密列挙アルゴリズム
- (1984) On a multicriteria shortest path problem
- Martin's Algorithm (元祖 Label Setting Approach)
- (JACM'91) Multiobjective A*
- 最初に single source でなく point-to-point にして global domination を導入したっぽい
- (EJOR'92) A multicriteria pareto-optimal path algorithm
- multidijkstra (MD).各コスト単体での距離(→下界)を前計算.
- (SEA'09) Pareto Paths with SHARC
- 前処理してる.次元が増えるとつらそう(変な制約を追加して厳密性を緩和してる)
- (ICDE'10) Route skyline queries: A multi-preference path planning approach
- ARSC
- reference node embedding という前処理により下界を前計算
- (2012) Multiobjective heuristic search in road maps
- クエリごとの前処理系
- (Arxiv'14) ParetoPrep: Fast computation of Path Skylines Queries
- グローバルな前処理はなし,クエリ事の前処理系
- MD とかより良い下界が計算できるから良い,みたいな感じっぽい
- みてない
- (2012) Faster Multiobjective Heuristic Search in Road Maps
- (2011) Multiobjective route planning with precalculated heuristics
- (2012) An Analysis of Some Algorithms and Heuristics for Multiobjective Graph Search
- (2013) A case of pathology in multiobjective heuristic search
その他
OR 系では multi-objective shortest path problem と呼ばれているらしい
- サーベイ
- (2000) A classification of bicriterion shortest path (bsp) algorithms
- (2009) A comparison of solution strategies for biobjective shortest path problems
- (2007) Selected multicriteria shortest path problems: An analysis of complexity, models and adaptation of standard algorithms
- (2000) A survey and annotated bibliography of multiobjective combinatorial optimization
- 指数個の Skyline があるので NP-Hard
- (1980) Multiple criteria decision making theory and application
- 相関が強ければ Skyline は少ない
- (2001) Pareto shortest paths is often feasible in practice
- FPTAS
- (1980) Multiple criteria decision making theory and application
- (1987) Approximation of pareto optima in multiple-objective, shortest-path problems
- (2006) Multiobjective optimization: Improved fptas for shortest paths and non-linear objectives with applications.
- 遺伝的アルゴリズム
- (2007) Evolutionary algorithms for the multi-objective shortest path problem
クラウドストレージを用いた個人データのバックアップ法の比較
クラウドストレージを使って,個人データの簡単かつ安心なバックアップを実現したい.現在の選択肢を調べてみた.
前提
自分がバックアップしたいデータは,写真が中心.現在 1TB 弱.
(ただ,将来的には数 TB 行きそう.)
Amazon S3/Glacier
有名なヤツ.1GB/1円.
- メリット
- データは 99.999999999% 保証.
- 完全従量制なので,容量の上限等を来にしなくて良い.
- デメリット
- ダウンロードが不便.
- 複数ヶ所でのデータの同期には使えない
- (関連して)料金体系が複雑.ミスるとダウンロードで莫大な請求が来る可能性がある.
- Amazon Glacier からデータを取り出すときには気をつけようね - takatoshiono's blog
- システムも個人向けに作られていないため面倒臭そう.
- ダウンロードが不便.
Google Drive
今年の 3 月に Google Drive が凄い安くなったらしい.1TB で $9.99/月.