2009年8月17日月曜日

普通に動くように。

このエントリーをブックマークに追加 このエントリーを含むはてなブックマーク
久々マックからの更新。
動くようになりました。
アップデートするとカーネルエラーがおこり
全部決してインストールし直さなきゃいけないので
アップデートができません。


まぁ、それはいいとして
ちょっとwikipediaで遺伝的アルゴリズムについて引いていたら
どんどん知らない言葉のリンクにつながっていって
どんどんつながっていってって

それってすごいんじゃないかって思った。
勉強するとき誰もが行き当たると思う
「辞書をひいては見たものの、そもそも解説で使われている言葉がわからない」
という現象。それが何回か続くと、結局引く気が起きずにわからなくなってしまう。
そういうやつ。

しかし、wikipediaにはそれがない!!
知識の枝がどんどん広がっていく。

というわけでその知識のつながりを
インターネットや言語解析という便利なツール
多分記事の関連性を視覚的に表したものがないかどうかということが気になった。
http://www.sfc.keio.ac.jp/flash/index.html
SFCの教員マップのように。

で、軽く調べてみると
http://www.google.co.jp/url?sa=t&source=web&ct=res&cd=5&url=http%3A%2F%2Fwww.dbsj.org%2FJapanese%2FDBSJLetters%2Fvol7%2Fno1%2Fpapers%2FNakayama.pdf&ei=ozaISuvHCNWSkAWwjJC9Bw&usg=AFQjCNHLFVK-BtXnzBN0h0Cehl-NdmH7UA&sig2=7X-WEpIdnBN6HU2_ZFS9xA

やってるやってる。俺が考えるレベルのことは当然やられているですが。
やっぱり面白い。

と調べてみるとwikipediaそのものにも載ってんじゃん!!
http://wikipedia-lab.org/ja/index.php/Wikipedia%E3%83%9E%E3%82%A4%E3%83%8B%E3%83%B3%E3%82%B0

=====================

知識獲得のためのWebコーパスとしてのWikipedia

密なリンク構造

筆者らは,予備実験として2006年9月の段階におけるWikipedia内におけるリンクの数をカウントした.約168万ページ(英語のみ)を解析したところ,約4,998万の内部リンク(リダイレクトリンクを除く)を抽出した.これは,一ページあたり平均29.62のリンクを持つ計算となる.また,Backwardリンクの分散を調査したところ,1万以上のBackwardリンクを持つ記事は196件,1,000以上のBackwardリンクを持つページは3,198件,100以上のBackwardリンクを持つページにいたっては67,515件も存在することを確認した.しかも,これらのリンクはサイト内に対するリンクのみをカウントしたものであり,サイト外へのリンクは含まれていない.これは,Wikipediaでは閉じられた語彙空間の中で密なリンク構造を持っており,リンク構造を解析することで有用な情報を抽出できる可能性を示している。


==================

うーん、おもしろい。

0 件のコメント:

コメントを投稿