2015-01-01から1ヶ月間の記事一覧
smallRNA-seqやCLIP-seqなどシークエンスされたリードにアダプター配列が入っています。これは、smallRNAやRNA結合タンパク質に結合しているRNA配列の長さが短いため、アダプター配列まで読まれているためです。 そのため、例えばilluminaが出している「TruS…
miRBaseは言わずと知れたmiRNAのデータベースですが更新のペースが早く(近年では年一回ペースと落ち着いている)、登録されているmiRNAのレコードが変更されたり、削除されることもしばしばです。 アクセッション番号はもちろん変更されることなく普遍的な…
いろんなRの参考書を読んでいて疑問に思っていたのが、パッケージをインポートする際に、人によって「require」と「library」の異なる関数を利用していることです。 stackoverflowに同じ疑問点を質問している人がいたので紹介します。 What is the differenc…
ecSeq Bioinformaticsで紹介されていたNGS解析用マッピングソフトの性能比較に関する記事を読んだので、内容をまとめておこうと思います。 結論から言って、ecSeq Bioinformaticsが出しているデータを見る限り、単純な性能だけで見ると、 RNA-seqでは「STAR…
Rでは「データフレーム」と呼ばれるExcelのワークシートのような行列形式のデータ構造を読み込むことができます。 Rではデフォルトで「read.table」関数が用意されており、テキストファイルからデータを読み込み、データフレームとしてファイルをインポート…