伯杰動(dòng)態(tài)

我們非常重視您的個(gè)人隱私,當(dāng)您訪問(wèn)我們的網(wǎng)站時(shí),請(qǐng)同意使用所有的cookie。如果您想詳細(xì)的了解我們?nèi)绾问褂胏ookie,請(qǐng)?jiān)L問(wèn)我們的 隱私政策.

X說(shuō) | AI與診斷②,AI在引物探針設(shè)計(jì)中的應(yīng)用,開啟核酸檢測(cè)新紀(jì)元

2025-02-27

圖片

導(dǎo)語(yǔ)

在分子診斷領(lǐng)域中,引物和探針的設(shè)計(jì)是核酸檢測(cè)和測(cè)序等方法的核心技術(shù)之一。傳統(tǒng)設(shè)計(jì)方法依賴人工經(jīng)驗(yàn)與反復(fù)試錯(cuò),效率低、周期長(zhǎng)且成本高昂,并且不具備設(shè)計(jì)方法本身的沉淀和持續(xù)進(jìn)化能力。隨著人工智能技術(shù)的突破,特別是近年來(lái)大模型的崛起,AI驅(qū)動(dòng)的引物探針設(shè)計(jì)正成為行業(yè)革新的關(guān)鍵引擎,推動(dòng)精準(zhǔn)醫(yī)療與科研效率邁向新高度。

眾所周知,理想的引物探針,特別是針對(duì)超多重病原體檢測(cè)的引物探針組,應(yīng)當(dāng)具備擴(kuò)增效率高,擴(kuò)增均一性好,非特異擴(kuò)增現(xiàn)象及引物二聚體少等特征,而這些特征依賴于靶序列本身的序列特征,如GC含量,基序,一級(jí)結(jié)構(gòu),二級(jí)結(jié)構(gòu)等,引物探針的序列特征,包括GC含量,退火溫度,引物長(zhǎng)度等,以及靶序列的豐度,依靠經(jīng)驗(yàn)很難發(fā)現(xiàn)潛在的有價(jià)值的序列特征。通過(guò)將千萬(wàn)級(jí)海量基因序列數(shù)據(jù)及其檢測(cè)結(jié)果進(jìn)行數(shù)據(jù)清洗和標(biāo)注,并訓(xùn)練大語(yǔ)言模型,可快速鎖定高擴(kuò)增效率且豐度高的候選序列。我司搭建的序列分析大模型正在開發(fā)中,目前已初步篩選出若干高相關(guān)性的序列特征。

圖片來(lái)源:網(wǎng)絡(luò)


大模型的訓(xùn)練需要耗費(fèi)相當(dāng)大的計(jì)算資源,并且需要海量實(shí)驗(yàn)數(shù)據(jù)(企業(yè)通常難以提供),而針對(duì)確定的,數(shù)量可控,且區(qū)分度高的特征,傳統(tǒng)機(jī)器學(xué)習(xí)算法則有數(shù)據(jù)需求量少,訓(xùn)練速度快,消耗資源少的優(yōu)勢(shì),而針對(duì)引物探針設(shè)計(jì),也同樣存在著依賴人工經(jīng)驗(yàn),易返工等問(wèn)題。在獲得明確數(shù)量的特征后,可通過(guò)特征降維并將數(shù)千組濕試驗(yàn)數(shù)據(jù)制成數(shù)據(jù)集,用于訓(xùn)練混合模型并形成引物探針設(shè)計(jì)模型。目前,該模型正在開發(fā)中,初步測(cè)試結(jié)果顯示,相對(duì)于人工設(shè)計(jì),該模型能夠?qū)⒁锾结樤O(shè)計(jì)成功率提高50%,設(shè)計(jì)速度提高80%,從而真正實(shí)現(xiàn)降本增效。


傳統(tǒng)引物探針設(shè)計(jì)通?;诿绹?guó)國(guó)家生物信息中心(NCBI)提供的非冗余核酸數(shù)據(jù)庫(kù)(NR)等公共數(shù)據(jù)庫(kù),這些數(shù)據(jù)庫(kù)通常面臨著數(shù)據(jù)量少,數(shù)據(jù)更新時(shí)效性差等問(wèn)題,從而降低引物探針設(shè)計(jì)質(zhì)量,容易造成試劑盒脫靶,漏檢。而人工智能模型的自適應(yīng)學(xué)習(xí)機(jī)制可以實(shí)時(shí)將最新的序列及其實(shí)驗(yàn)結(jié)果進(jìn)行在訓(xùn)練,更新模型參數(shù)和數(shù)據(jù)庫(kù),在快速變異的病毒監(jiān)測(cè)場(chǎng)景中,實(shí)時(shí)追蹤新發(fā)突變,智能調(diào)整引物探針設(shè)計(jì)區(qū)域,從而避免脫靶和漏檢問(wèn)題。

從科研到臨床,AI正重新定義引物探針設(shè)計(jì)的邊界。我們致力于將復(fù)雜的生物信息學(xué)轉(zhuǎn)化為簡(jiǎn)單易用的智能工具,讓研究人員更專注于科學(xué)發(fā)現(xiàn)本身。通過(guò)持續(xù)迭代算法模型、整合多組學(xué)數(shù)據(jù),我們期待與全球合作伙伴共同構(gòu)建更高效、更智能的分子檢測(cè)生態(tài),為人類健康事業(yè)創(chuàng)造持久價(jià)值。


文字丨伯杰醫(yī)學(xué)健康X研究院

編輯丨品牌宣傳部

圖片 | 來(lái)源于伯杰醫(yī)療

圖片