普段、Windows10が入ったノートパソコンを利用していて、解析を行うためにLinuxの入ったデスクトップパソコンを使うことがあります。 恥ずかしい話ですが、今までデータのやり取りをパソコン間で行うために、外付けのハードディスクを使って行っていました。…
CentOSを利用していたとき、CPU・メモリの負荷状態を視覚化するツールが常駐しており、今どれくらいの負荷状態にあるか確認できて便利だなぁと感じていました。 UbuntuやBioLinuxではそのような可視化ツールは入っていないので、適当なツールを導入したいと…
BioLinux8はLinuxディストリビューションであるUbuntu14.04をベースにつくられており、あらかじめバイオインフォマティクス解析用のソフトウェアがインストールされているから初心者向きだと聞きますが、思わぬ落とし穴があったので紹介します。 Ubuntu14.04…
BioLinux8は、Linuxのディストリビューションの1つであるUbuntu14.04をベースに作られたバイオインフォマティクス解析に特化したLinux OSです。 <a href="http://environmentalomics.org/bio-linux/" data-mce-href="http://environmentalomics.…
最近Pythonを使って、特定のmicroRNAが結合するSeed配列をmRNAの配列中から探索して、さらに種間保存性や配列の特徴を解析するスクリプトを思いつくままに書いたのですが、 実行してみて、そのスクリプトがやたら遅いことに気づきました(-_-;) 「1つのmiRNA…
smallRNA-seqやCLIP-seqなどシークエンスされたリードにアダプター配列が入っています。これは、smallRNAやRNA結合タンパク質に結合しているRNA配列の長さが短いため、アダプター配列まで読まれているためです。 そのため、例えばilluminaが出している「TruS…
miRBaseは言わずと知れたmiRNAのデータベースですが更新のペースが早く(近年では年一回ペースと落ち着いている)、登録されているmiRNAのレコードが変更されたり、削除されることもしばしばです。 アクセッション番号はもちろん変更されることなく普遍的な…
いろんなRの参考書を読んでいて疑問に思っていたのが、パッケージをインポートする際に、人によって「require」と「library」の異なる関数を利用していることです。 stackoverflowに同じ疑問点を質問している人がいたので紹介します。 What is the differenc…
ecSeq Bioinformaticsで紹介されていたNGS解析用マッピングソフトの性能比較に関する記事を読んだので、内容をまとめておこうと思います。 結論から言って、ecSeq Bioinformaticsが出しているデータを見る限り、単純な性能だけで見ると、 RNA-seqでは「STAR…
Rでは「データフレーム」と呼ばれるExcelのワークシートのような行列形式のデータ構造を読み込むことができます。 Rではデフォルトで「read.table」関数が用意されており、テキストファイルからデータを読み込み、データフレームとしてファイルをインポート…