据新华社电 美国研讨职员开辟出一个新的人工智能模子,经由大批数据的练习后,该模子能准确猜测种种人体细胞外部的基因表白情形,将为生物跟医学研讨带来方便。这个名为“通用表白转换器”(GET)的模子由美国哥伦比亚年夜学跟卡内基-梅隆年夜学等机构研讨职员结合开辟,其正确性跟无效性已失掉试验验证。相干论文宣布在新一期英国《天然》杂志上。在基因表白进程中,以DNA情势贮存的基因“蓝图”转录成为RNA情势的“手本”,后者领导分解出卵白质,履行详细的心理功效。参加转录调控的生物分子品种单一,彼此感化极为庞杂,此前相干猜测模子范围于多少种特定的细胞,尤其是癌细胞,缺少实用于人体多种细胞范例的通用东西。研讨职员依据转录调控机制的特色计划出呆板进修模子,而后用来自1.3万团体体细胞的基因测序跟表白数据对其停止练习。这些细胞涵盖213种人类胚胎细胞跟成体细胞,都来自不病变的畸形人体构造。就像ChatGPT等人工智能东西能依据大批语料总结出通用语法例则,GET模子也能从练习数据中总结出对于转录调控的“语法”,在此基本上能对其不打仗过的细胞范例停止基因表白猜测。该模子可用于提醒致病基因的感化机制,领导癌症跟遗传疾病研讨。比方某种儿童白血病的患者携带一个功效不明的变异基因,GET模子猜测该基因会捣乱细胞中两种转录因子的彼此感化,试验数据证明了这一论断。研讨职员说,该模子还可用于探寻基因组中“暗物资”的感化。卵白质编码基因序列只占人类基因组的一小局部,占比达98%的非编码地区就像宇宙中的暗物资一样,其属性跟功效现在难以捉摸。(王艳红)