omim数据库中文版官网查询(omim数据库怎么查疾病靶点)
OMIM 为“Online MendelianInheritance in Man”的简称,它通过对新的病症分类并命名、收录表型和相关病因基因的关系来收录人类孟德尔疾病信息。所以我们可以通过表型或者基因型来搜索对应的信息。通过网址登陆到OMIM的主页:
用户可通过主页中央的搜索框可完成简单的搜索任务,主页顶端的导航栏会对网站做相关性的介绍,这里仅介绍下该网站的词条统计性信息:
这里记录了截止2017年3月6日的词目记录统计量,根据位置分为了常染色体、X染色体、Y染色体和线粒体的收录统计情况。我们需要注意的是MIM Number Prefix栏的信息,这里解释了MIM的数字前缀的意义:(1.3 What do thesymbols preceding a MIM number represent?)
符号 |
含义 |
星号(*) |
该记录是一个基因 |
井号(#) |
这是一个描述性的记录,常常是一个表型,而不是一个唯一的基因座, |
加号(+) |
该记录包含了已知序列的基因和表型的描述 |
百分号(%) |
该记录描述了一个经过证实的孟德尔表型或表型的基因座,但是潜在的分子基础未知 |
无符号前缀 |
该符号表明这个记录是一个表型的描述,但是它的孟德尔疾病基础还未被清楚地证实,或者该表型与其他搜索记录的区别尚不清晰 |
脱字符(^) |
该记录已经不复存在,可能已经从数据库中删除或换成了其他词目 |
另外针对OMIM的收录条目的数字使用也有区别:(1.2 What numbering system is used in the OMIM database?)
每一个收录条目都使用了一个唯一的6位数字表示:
数字 |
说明 |
1-----(1000000) 2-----(200000) |
常染色体基因位点或表型(创建于1994年5月15日前) |
3-----(300000) |
X染色体关联的基因位点或表型 |
4-----(400000) |
Y染色体关联的基因位点或表型 |
5-----(500000) |
线粒体基因座或表型 |
6-----(600000) |
常染色体基因位点或表型(创建于1994年5月15日后) |
另外OMIM数据库的内容主要包括如下信息:
表型 |
示例 |
单个基因的孟德尔疾病、失调和表型 |
囊性纤维化,镰状细胞性贫血,软骨发育不全,表型性特征例如头发眼睛颜色不同,药物反应例如恶性高体热和华法林敏感性,可变的感染反应例如单纯疱疹(性)脑炎和发展为艾滋病的HIV感染,癌症的胚系易感基因例如BRCA1和乳腺癌卵巢癌,等等 |
具有显著性的单基因致病的复杂疾病 |
补体因子H和年龄相关的黄斑变性 |
复发性缺失和重复综合症 |
Potocki-Shaffer综合症和染色体10q26缺失综合症 |
对于一个查询网站,我觉得最重要的是搜索功能,通过主页的导航栏的Help链接我们可以查看到OMIM的搜索规则:
这里介绍了很多搜索帮助,简述如下:
搜索方式 |
说明 |
示例 |
基本搜索 |
简单输入词目 |
duchenne muscular dystrophy |
加号运算符做前缀(+) |
确保结果包含输入的搜索条目 |
+duchenne |
减号运算符做前缀(-) |
搜索结果不包含搜索条目 |
-duchenne |
短语搜索 |
只返回包含该短语的搜索结果 |
"duchenne muscular dystrophy" |
通配符搜索(*?) |
作为搜索条目的通配符,*表示搜索条目接多个字符,?表示搜索条目接单个字符 |
dystroph* dystrophi? dystro??i? |
搜索域搜索(title:) |
指定搜索该搜索域的内容 |
title: Duchenne title:duchenne title:muscular |
布尔运算符 |
支持布尔运算符的功能 |
AND NOT OR 等同于加减号前缀和或者 |
染色体位置搜索 |
指定包含的起始区域 |
1p36-p32 |
基因组坐标搜索 |
指定基因组的起始位置 |
1:12,000,000-48,000,000 |
通过前面的简介和说明我们尝试搜索下,例如:Parkinson
打开基本搜索结果界面():
图示是基本搜索返回界面的部分截图,在图中1号框位置我们可以对该搜索条目进行进一步的Gene Map Table和Clinical Synopsis搜索,这里分别会反馈搜索条目(Parkinson)相关染色体基因位置和临床简介信息,下面2号框(Hightlights)我们可以选择在结果中高亮搜索条目;在3号框位置的第一个返回结果为前缀为#号的描述性结果(#168600,PARKINSO DISEASE,LATE-ONSET; PD),下面描述了该疾病相关的染色体位置:1q22,4q23等等。接着是依次是表型基因型的关联信息(Phenotype-Gene Relations),表型系列的信息(Phenotypic Series),这里指的是相似表型的遗传异质性信息、对疾病的分类信息(ICD+)和疾病相关的外部链接(Links)。表型基因型的关联信息,点开可得一下拉表格:
我们可以看到图示框中分别有基因位置、对应表型、表型的MIN编号、遗传特点、表型对应到基因型的基础情况、基因位置和基因/位点的MIM编号,另外我们将鼠标放到相应信息位置可以看到对该信息的简单解释。点开表型系列可得下表:
OMIM对表型系列做了分类,每一类表型都有一个编号,这里Parkinson疾病所属表型系列编号为:PS168600;我们可能会注意到这里的表型描述有的加了大括号,有的加了问号,该符号对表型也进行了分类说明:
类型 |
说明 |
中括号([]) |
非疾病,主要的遗传变异会导致异常的研究检测值 |
大括号({}) |
突变怀疑导致了多因素的病症或感染 |
问号(?) |
表明表型和基因型之间的关联是暂时的,更详细的关联信息提供在详情中 |
病症后括号内的数字(1/2/3/4) |
(1)病症对应到了野生型基因;(2)疾病本身被比对到了基因;(3)病症的分子基础已知;(4)病症是由于染色体的缺失或复制 |
同时表型比对信息(Phenotype Mapping Key)的数字也有不同的解释说明:
关键数字 |
说明 |
1 |
该病症的位置的确定是由于它与基因的关系,但是潜在的缺陷未知 |
2 |
该病症的位置比确认是通过统计的方式 |
3 |
该病症的分子基础已知 |
4 |
该病症是由连续的基因复制或删除,由多基因所涉及 |
通过以上信息我们可以进行简单搜索并快速浏览搜索条目的基因型和表型信息!
我们现在点开第一个搜索结果(#168600. PARKINSON DISEASE, LATE-ONSET; PD),进入表型结果界面:
这是表型结果界面的部分截图,1号框显示了表型的条目信息,长且详细;2号框显示了该条目的别称;3号框列出了表型界面的内容,点击相应内容即可完成跳转;4号框对应了该表型的外部链接信息;5号框是一个列表,对应了表型和基因型的关系;6号框有临床概况(Clinical Synopsis)和表型系列信息(Phenotypic Series),点开可得相应的信息列表,其中表型系列信息(Phenotypic Series)和搜索结果界面的信息一样!
我们看下表型结果界面的临床概况(Clinical Synopsis)的下拉信息:
依次可以看到Parkinson的遗传特点属于个别情况,多因素遗传;身体各部位临床特征等信息,点击对应左侧的表型结果界面内容列表的链接可跳转至更详细的临床特征信息。
我们回来看下表型基因型的关联性表格(Phenotype-GeneRelationships),它包含了多个链接:
Location链接到该染色体区域的相关基因信息;Phenotype MIM number链接到该表型结果界面;Gene/Locus MIMnumber链接到与该基因相关的表型信息。
例如图中Location链接1q22,对应到了1号染色体长臂2区2带的基因信息:
例如点击图中Gene/Locus MIMnumber链接606436,对应显示了以该基因为搜索条目的相关表型信息:
这里我们注意到左侧的等位基因变异情况(AllelicVariants),点击完成跳转:
图中1号框表示总共列出48个突变例子,2号框是一个列表链接,列出了总共48个被挑选出来的变异信息。FAQs页面对突变收录的选择进行说明(1.4 How are mutations cataloged in OMIM?):被收录的突变包含第一个被发现的相关突变,高频发生的突变,涉及到明确表型的突变,历来具有显著性的突变,具有不寻常的突变机制的突变,不寻常的致病机制的突变和明确遗传性的突变(例如:同一个基因上的决定性突变,伴随其他突变的阴性突变)。这里大部分的突变都是与致病相关的。同时包含了少数多态性,它们多数有部分共有的失调症状具有正相关性。
下面我们再介绍下OMIM的高级搜素模式:
我们可有选择OMIM、Clinical Synopsis和Gene Map三种搜索方式,另外这些搜索链接不仅仅在主页可以被选择到,其他界面也可以进行选择。
OMIM高级搜索():
这里包含了多种搜索选择,可以定义输入的搜索词条范围(SearchIn),搜索结果所具备的记录信息(OnlyRecords With),通过前缀限制输出结果(MIMNumber Prefix),限制搜索的染色体区域(Chromosome)以及收录时间(Dates)等。
ClinicalSynopsis高级搜索():
这里就针对临床特征(Only entries with)和收录日期(Dates)对搜索进行了分类。
Gene Map高级搜索界面如下():
这里的搜索模式就涉及到了最开始搜索方式简述和针对所属染色体的搜索(Chromosome)。
最后对OMIM的数据下载就不做介绍,我用了同学的edu后缀邮箱注册了,但还未通过。不要方,网站有无需注释的txt文件可供下载,感兴趣的可以下来打开看看。如果还有疑问请查询OMIM的Help界面,这里就不赘述了!
生信菜鸟专栏
生信菜鸟专栏是生信技能树论坛的版主团队的专栏,团队成员生信技能背景丰富,文件格式,数据资源,软件使用,脚本技巧,统计绘图,组学实战均有对应人才。而本专栏将从基础到深入,为零基础的各位剖析生信技能。
Freescience精彩内容回顾
| | | | ||,数据库寻找靶基因|| |
科研路,不孤单!^ ^
Freescience医学科研联盟全国火热招募ing
50家高校及医院的小伙伴已经加入啦,
Bioart/Freescience科研沙龙,详情进入沙龙QQ群,(进入后,扫底部二维码)
FS科研软件库,集合60+医学科研必备神器,现在统统打包分享,
有质、有趣的科研问答平台—研论()
科学自由共享
投稿请扔至:freescience@zju.edu.cn
上一篇: 李海川这个名字好不好,李海川 长宁妇幼