2015-01-01から1ヶ月間の記事一覧

NGS関係(2) Adapter sequence letter for illumina customers

smallRNA-seqやCLIP-seqなどシークエンスされたリードにアダプター配列が入っています。これは、smallRNAやRNA結合タンパク質に結合しているRNA配列の長さが短いため、アダプター配列まで読まれているためです。 そのため、例えばilluminaが出している「TruS…

データベース関係(1) miRBase Tracker - 地味に便利なmiRBaseのバージョン比較データベース

miRBaseは言わずと知れたmiRNAのデータベースですが更新のペースが早く(近年では年一回ペースと落ち着いている)、登録されているmiRNAのレコードが変更されたり、削除されることもしばしばです。 アクセッション番号はもちろん変更されることなく普遍的な…

R関連(1) requireとlibraryの違い -パッケージのインポート

R

いろんなRの参考書を読んでいて疑問に思っていたのが、パッケージをインポートする際に、人によって「require」と「library」の異なる関数を利用していることです。 stackoverflowに同じ疑問点を質問している人がいたので紹介します。 What is the differenc…

NGS関連(1) NGS解析用マッピングソフトの性能比較

ecSeq Bioinformaticsで紹介されていたNGS解析用マッピングソフトの性能比較に関する記事を読んだので、内容をまとめておこうと思います。 結論から言って、ecSeq Bioinformaticsが出しているデータを見る限り、単純な性能だけで見ると、 RNA-seqでは「STAR…

Rパッケージ(1) data.tableを利用したデータの読み込み・整形処理

Rでは「データフレーム」と呼ばれるExcelのワークシートのような行列形式のデータ構造を読み込むことができます。 Rではデフォルトで「read.table」関数が用意されており、テキストファイルからデータを読み込み、データフレームとしてファイルをインポート…