AGD Research ID: agd0008.v2

 

研究内容の概要

目的: 全ゲノムシークエンスによる心筋梗塞、胃がん、認知症患者疾患関連遺伝子解析

方法: Illumina HiSeqによる全ゲノム解析

対象: 2003年から2017年度にバイオバンク・ジャパンに登録された心筋梗塞(1765名)、胃がん(255名)、認知症(199名)

URL: http://www.biobankjp.org/index.html

 

データID内容制限公開日
AGDS_000005 NGS(WGS) 制限共有 2019/07/23
AGDS_000005(データ追加) 胃がんのWGSデータのbam/gvcfデータ 制限共有 2022/02/01

※リリース情報はこちら

※制限共有データの利用にあたっては、利用申請が必要です。申請方法はこちら

 

分子データ

AGDS_000005(2022年1月25日に心筋梗塞(1765名)と認知症(199名)データはJGAへ移行されました:hum0014.v25

対象

2003年から2017年度にバイオバンク・ジャパンに登録された症例:2219名

    心筋梗塞(ICD10:I21):1765症例

    胃がん(ICD10:C16):255症例

    認知症(ICD10:F00-03):199症例

規模 WGS
対象領域(Target Captureの場合) -
Platform

心筋梗塞:Illumina [HiSeq X Five]

胃がん:Illumina [HiSeq 2500]

認知症:Illumina [HiSeq X Five]

ライブラリソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名)

心筋梗塞:TruSeq DNA PCR-Free Prep kit

胃がん:TruSeq DNA Nano library kit

認知症:TruSeq DNA PCR-Free Prep kit

断片化の方法 超音波断片化
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー)

心筋梗塞:151 bp

胃がん:125 bp/126 bp

認知症:151 bp

クオリティコントロール方法

リードのbase qualityが全体的に悪い検体、リード毎の%GCの結果にて異常を示した検体を除去。

Alignment後、Low mapping rate検体、Insert sizeがおかしい検体、メタデータの性別情報とalingment結果より推定される性別情報が不一致な検体、性染色体異常疑いの検体を除去。

Genotyping時に、VQSR、DP/GP filter (DP < 5, GQ < 20, DP > 60 && GQ < 95を除去)、heterozygosity filter (F>=0.05 を除去)、HWE filter (p < 10-6を除去)、Repeat & Low Complexity filterを実施。

1000 genomes projectと合わせたPCAを実施し、日本人クラスタから大きく外れる検体を除外。

その後、Genome-In-A-Bottleプロジェクトから公開されているHighConfidenceRegionリストに記載のある領域のバリアントにフラグを付与。

重複するリードの除去 Picard 2.10.6
リアライメントおよびベースクオリティのキャリブレーション GATK 3.7
マッピング方法 BWA mem 0.7.12
マッピングクオリティ GATK 3.7 HaplotypeCallerで変異コール時にMAPQ<20のリードを除外
マッピングの際のリファレンス配列 GRCh37/hg19(hs37d5)
平均カバー率(Depth) 30.0x
変異検出方法 GATK 3.7 HaplotypeCaller
SNV数(QC後)

76,768,387(常染色体)

2,898,518(X 染色体)

INDEL数(QC後)

10,202,908(常染色体)

410,435(X 染色体)

Amed Genome group sharing Database Data set ID

AGDD_000005(fastq)

AGDD_000010(bam、vcf):GEnome Medical alliance Japan(GEM Japan, GEM-J)の取り組みとして、GATK Best Practicesに準拠した方法により、GRCh37の参照ゲノム配列へのマッピングおよびバリアント検知を実施した際のデータです。詳しくはこちらをご覧ください。

総データ量 112 TB(fastq)➡胃がんのみ21.4 TB(fastq)+17.3 TB(bam、vcf)
コメント(利用にあたっての制限事項) AGD policy

 

提供者情報

研究代表者: 松田 浩一 / 桃沢 幸秀

所 属 機 関: 東京大学大学院新領域創成科学研究科 / 理化学研究所

プロジェクト/研究グループ名: オーダーメイド医療の実現プログラム

URL: http://www.biobankjp.org/index.html

科研費/助成金(Research Project Number):

科研費・助成金名タイトル研究課題番号
文部科学省 科学技術試験研究委託事業費 オーダーメイド医療の実現プログラム(第3期) -

 

関連論文

タイトルDOIデータID
1 -
2