BioLinux/Ubuntu(4) 公開鍵認証を利用したSSHによるリモート接続(Windows10=>BioLinux8)

普段、Windows10が入ったノートパソコンを利用していて、解析を行うためにLinuxの入ったデスクトップパソコンを使うことがあります。 恥ずかしい話ですが、今までデータのやり取りをパソコン間で行うために、外付けのハードディスクを使って行っていました。…

BioLinux/Ubuntu(3) CPU・メモリの負荷状態を視覚化するツール - sysmonitor

CentOSを利用していたとき、CPU・メモリの負荷状態を視覚化するツールが常駐しており、今どれくらいの負荷状態にあるか確認できて便利だなぁと感じていました。 UbuntuやBioLinuxではそのような可視化ツールは入っていないので、適当なツールを導入したいと…

BioLinux(2) BioLinux8の思わぬ落とし穴 - ログイン時のシェルは"bash"ではなく"zsh"

BioLinux8はLinuxディストリビューションであるUbuntu14.04をベースにつくられており、あらかじめバイオインフォマティクス解析用のソフトウェアがインストールされているから初心者向きだと聞きますが、思わぬ落とし穴があったので紹介します。 Ubuntu14.04…

BioLinux(1) BioLinux8をデスクトップパソコンにインストールしてみた

BioLinux8は、Linuxのディストリビューションの1つであるUbuntu14.04をベースに作られたバイオインフォマティクス解析に特化したLinux OSです。 <a href="http://environmentalomics.org/bio-linux/" data-mce-href="http://environmentalomics.…

Python(1) PyCallGraphを利用したコードプロファイリングの可視化

最近Pythonを使って、特定のmicroRNAが結合するSeed配列をmRNAの配列中から探索して、さらに種間保存性や配列の特徴を解析するスクリプトを思いつくままに書いたのですが、 実行してみて、そのスクリプトがやたら遅いことに気づきました(-_-;) 「1つのmiRNA…

NGS関係(2) Adapter sequence letter for illumina customers

smallRNA-seqやCLIP-seqなどシークエンスされたリードにアダプター配列が入っています。これは、smallRNAやRNA結合タンパク質に結合しているRNA配列の長さが短いため、アダプター配列まで読まれているためです。 そのため、例えばilluminaが出している「TruS…

データベース関係(1) miRBase Tracker - 地味に便利なmiRBaseのバージョン比較データベース

miRBaseは言わずと知れたmiRNAのデータベースですが更新のペースが早く(近年では年一回ペースと落ち着いている)、登録されているmiRNAのレコードが変更されたり、削除されることもしばしばです。 アクセッション番号はもちろん変更されることなく普遍的な…

R関連(1) requireとlibraryの違い -パッケージのインポート

R

いろんなRの参考書を読んでいて疑問に思っていたのが、パッケージをインポートする際に、人によって「require」と「library」の異なる関数を利用していることです。 stackoverflowに同じ疑問点を質問している人がいたので紹介します。 What is the differenc…

NGS関連(1) NGS解析用マッピングソフトの性能比較

ecSeq Bioinformaticsで紹介されていたNGS解析用マッピングソフトの性能比較に関する記事を読んだので、内容をまとめておこうと思います。 結論から言って、ecSeq Bioinformaticsが出しているデータを見る限り、単純な性能だけで見ると、 RNA-seqでは「STAR…

Rパッケージ(1) data.tableを利用したデータの読み込み・整形処理

Rでは「データフレーム」と呼ばれるExcelのワークシートのような行列形式のデータ構造を読み込むことができます。 Rではデフォルトで「read.table」関数が用意されており、テキストファイルからデータを読み込み、データフレームとしてファイルをインポート…