パネルディスカッション「ゲノム時代のデータベース」
ITBL にパネルディスカッション「ゲノム時代のデータベース」のパネラーとして参加しました。
話題提供スライドのフルスクリプト
- BioRuby Project
- http://bioruby.org
- オブジェクト指向スクリプト言語 Ruby による Bioinformatics のためのオープンソースライブラリ
- 塩基、アミノ酸配列クラス
- IO クラス
- データベースエントリパーサ
- ツールのリーポートパーサ
- データベースパーサをつくっていて思うところ
- ドキュメント
- 仕様を公開してほしい
- リバースエンジニアリングは本末転倒
- 仕様を公開してほしい
- QC
- 仕様とおりのデータであってほしい
- ライセンス
- 非商用利用 != アカデミック利用
- データ取得、交換のインターフェイス
- 機械可読性
- スケーラビリティ
- ドキュメント
- データ取得、交換のインターフェイス
- 機会に優しいインターフェイスの共有の試み
- DAS http://BioDAS.org
- OBDA http://obda.open-bio.org
- BSML http://www.bsml.org
- さまざまなデータベースを横断的に解析するきたるべきこれからは、分散データベースが普及すれば良いなと思います。
- データを公開する側のメリット
- 典型的なユーザインターフェイスを再利用できる
- データの再利用性、価値が向上する
- データを使う側のメリット
- さまざまなデータベースをオンデマンドに参照できる
- スモールスケールの利用は、まるっと全部ダウンロードする必要が無い
- 常に最新のデータ(諸刃の剣)
- データを公開する側のメリット