Molecular Plant | 華中農(nóng)業(yè)大學(xué)領(lǐng)銜倡導(dǎo)CropGPT作物智能育種新模式
日期:2023-12-28 11:19:02

農(nóng)業(yè)工作促進(jìn)了作物產(chǎn)量增加,滿足了糧食需求。糧食產(chǎn)量提高主要?dú)w功于品種遺傳改良和栽培管理方法提升。作物育種技術(shù)的發(fā)展主要分為四個階段,目前已進(jìn)入到第四代的智能育種,但全球育種水平大部分停留在常規(guī)育種階段。面對人口增長的挑戰(zhàn),需要整合現(xiàn)代的最新技術(shù),提升育種技術(shù),進(jìn)一步加快遺傳改良進(jìn)程。

2023年12月22日,由華中農(nóng)業(yè)大學(xué)玉米團(tuán)隊(duì)李林教授領(lǐng)銜,聯(lián)合國內(nèi)多個研究團(tuán)隊(duì),在Molecular Plant在線發(fā)表了題為The CropGPT project: A call for a global, coordinated effort in precision design breeding driven by AI using biological big-data 的文章。該文向全球發(fā)起了開放、共享與合作的智能育種倡導(dǎo)——CropGPT,探討了如何整合現(xiàn)有資源(包括種質(zhì)、生物大數(shù)據(jù))及人工智能方法、升級現(xiàn)有育種技術(shù),并提出了可能的運(yùn)作流程及潛在理論基礎(chǔ)。

作物產(chǎn)量是一個復(fù)雜的性狀,涉及復(fù)雜的基因調(diào)控網(wǎng)絡(luò)和品種差異性。因此,系統(tǒng)分析基因的調(diào)控突進(jìn),引入平衡多個性狀的最佳等位基因,是確?;虼龠M(jìn)產(chǎn)量提高的有效途徑。隨著測序技術(shù)的發(fā)展,多種基因組學(xué)數(shù)據(jù)可以與蛋白質(zhì)組學(xué)及代謝組學(xué)數(shù)據(jù)相結(jié)合,系統(tǒng)地研究每個遺傳層內(nèi)或不同遺傳層之間功能元件的相互作用,從而產(chǎn)生網(wǎng)絡(luò)大數(shù)據(jù)(NBD)。人工智能和基因編輯等多種先進(jìn)技術(shù)被用于NBD 挖掘已有報道。

Generative Pre-trained Transformers(GPT)是一種強(qiáng)大的語言模型,它們利用轉(zhuǎn)換器模型(一種基于自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)模型)從廣泛的訓(xùn)練數(shù)據(jù)中學(xué)習(xí)并生成文本。自然語言處理(NLP)可用于處理多模式輸入如基因組學(xué)、環(huán)境參數(shù)、田間管理及其相互作用。GPT/NLP 的繁榮為通過增強(qiáng)生物大數(shù)據(jù)的分析,進(jìn)行精準(zhǔn)的智能設(shè)計(jì)育種帶來了希望。因此,該研究論文提出CropGPT 新概念,并向全球發(fā)起CropGPT 智能設(shè)計(jì)育種合作倡導(dǎo)。CropGPT 的成功開發(fā)將需要兩個主要要素,一是合作與整合,二是作物育種的多模式GPT。該項(xiàng)目將堅(jiān)持開放、合作以及共贏的團(tuán)隊(duì)育種模式,需要育種家、生物學(xué)家、數(shù)學(xué)家、計(jì)算機(jī)學(xué)家、育種公司和生物技術(shù)公司之間的合作(圖1A)。首先育種家提供基礎(chǔ)的育種資源,育種公司利用DH 等工程化技術(shù)構(gòu)建育種群體。其次,生物學(xué)家利用多組學(xué)數(shù)據(jù)構(gòu)建基因網(wǎng)絡(luò)結(jié)合AI 技術(shù)鑒定基因-性狀調(diào)控關(guān)系,提供大量與特定性狀相關(guān)的功能基因集合。此外靶向基因分型檢測需要提高標(biāo)記的有效性,高通量基因分型(與特定性狀相關(guān)的基因)和表型分型(種群)將通過生物技術(shù)公司的協(xié)同努力進(jìn)行。然后,數(shù)學(xué)家整合基因型數(shù)據(jù)、表型數(shù)據(jù)和環(huán)境因素來開發(fā)合適的大數(shù)據(jù)模型,而計(jì)算機(jī)學(xué)家通過模型預(yù)測合適的組配方式并提供建議。最后育種家/生物家根據(jù)育種建議進(jìn)行雜交組合配制和基因編輯,根據(jù)性狀鑒定優(yōu)質(zhì)材料或組合。優(yōu)質(zhì)的組配材料可直接進(jìn)行商業(yè)化應(yīng)用,同時也可以再次加入基礎(chǔ)種質(zhì),通過迭代優(yōu)化大數(shù)據(jù)模型。


圖123122801s.jpg

圖1 CropGPT智能設(shè)計(jì)育種架構(gòu)


多模式GPT 將開發(fā)用于作物育種,數(shù)學(xué)家將基于大規(guī)模的育種語料庫開發(fā)合適的育種語言模型,這是CropGPT 成功的關(guān)鍵因素。在此基礎(chǔ)上,研究人員的目標(biāo)是在CropGPT 中開發(fā)一種特征融合方法,該方法使用獨(dú)立的預(yù)訓(xùn)練編碼器來處理多模態(tài)數(shù)據(jù),包括表型、環(huán)境因素、基因型、多組學(xué)數(shù)據(jù)、基因網(wǎng)絡(luò)和文本等,從而統(tǒng)一生命語言。理想情況下,神經(jīng)網(wǎng)絡(luò)和自監(jiān)督學(xué)習(xí)技術(shù)將被整合到CropGPT 中,以實(shí)現(xiàn)多種模態(tài)數(shù)據(jù)和人類自然語言之間的對齊和翻譯。最終期望CropGPT 能夠?qū)崿F(xiàn)自由文本查詢、多模態(tài)輸入,并支持不同的下游任務(wù)(圖1B)。

綜上所述,CropGPT項(xiàng)目旨在協(xié)同應(yīng)用DH技術(shù)、人工智能、基因組編輯、多組學(xué)等多種前沿技術(shù),對基礎(chǔ)種質(zhì)資源進(jìn)行分析和豐富,開發(fā)最優(yōu)生物大數(shù)據(jù)模型(LLMs/GPT),提高育種的精準(zhǔn)設(shè)計(jì)。

—— 原文 ——

Zhu W, Han R, Shang X, et alThe CropGPT project: A call for a global, coordinated effort in precision design breeding driven by AI using biological big-data[J]. Molecular Plant, 2023, 16: 206-231.

實(shí)驗(yàn)室-溫室-田間的一體化DH生產(chǎn)服務(wù)+基因編輯服務(wù)+高通量表型儀器和服務(wù)方案

北大荒墾豐種業(yè)-澤泉科技生物技術(shù)與表型服務(wù)中心是由北大荒墾豐種業(yè)股份有限公司和上海澤泉科技股份有限公司共同建設(shè)的開放式高通量植物基因型-表型-育種服務(wù)平臺。中心建立了基因克隆和載體平臺、作物轉(zhuǎn)化系統(tǒng)、基因型分析平臺、表型鑒定分析平臺、數(shù)據(jù)分析和利用平臺等現(xiàn)代化生物技術(shù)和信息支持平臺,是定位于為植物科研和作物育種提供植物基因型-表型-育種數(shù)據(jù)分析的科研服務(wù)平臺。

為了縮短您的育種進(jìn)程,提高您的育種成功率,北大荒墾豐種業(yè)-澤泉科技生物技術(shù)與表型服務(wù)中心將為您提供DH服務(wù)技術(shù)流程(實(shí)驗(yàn)室-溫室-田間一體化服務(wù))、測序服務(wù)、高通量表型儀器和服務(wù)。

實(shí)驗(yàn)室-溫室-田間的一體化DH生產(chǎn)服務(wù)

單倍體產(chǎn)生:父本誘導(dǎo)系誘導(dǎo)母本材料,孤雌生殖,產(chǎn)生單倍體種子(幼胚)。

剝胚及培養(yǎng):20-60份/皿。置于人工培養(yǎng)室(帶光照層架)或人工培養(yǎng)箱中培養(yǎng)48小時左右。

挑選:將幼胚在體視熒光顯微鏡下觀察或者在日光燈下觀察,以自交系所得幼胚為對照。因?yàn)殡s合二倍體含有父本基因,所以單倍體有微弱熒光或無色。

生苗:將挑選的擬單倍體直接置于含有加倍藥劑(秋水仙素)的MS培養(yǎng)基上,暗培養(yǎng);后轉(zhuǎn)入不含加倍藥劑的MS培養(yǎng)基,暗培養(yǎng)后光照培養(yǎng),待幼苗2葉一心時移至培養(yǎng)瓶中(MS培養(yǎng)基)。

煉苗:將培養(yǎng)瓶中DH系幼苗在4葉一心時移栽至苗缽,在溫室中煉苗。

移栽:待幼苗5-6葉期移栽至溫室花盆或大田,待散粉時,及時套袋進(jìn)行自交授粉。

收獲:田間收獲和鑒別。如果用采用花藥離體培養(yǎng)單倍體的方法,則省去觀察幼胚的步驟,其余步驟基本相同。

靶向測序服務(wù)

靶向測序技術(shù)主要分為基于多重PCR的靶向基因捕獲技術(shù)(GenoPlexs)和基于液相探針雜交的靶向基因捕獲技術(shù)(GenoBaits)兩種??赏瓿蓡螛悠?0-5000和3000-40000標(biāo)記的基因型分析,并達(dá)到可設(shè)計(jì)區(qū)域覆蓋度高于95%,擴(kuò)增子均一性高于90%的捕獲效率。

高通量表型儀器和服務(wù)方案

突變株作為育種的主要載體,篩選與鑒定工作復(fù)雜而繁重。高通量表型分析設(shè)備和熒光成像系統(tǒng)都可服務(wù)于突變株的篩選,具體體現(xiàn)在對一些物理誘變和化學(xué)誘變產(chǎn)生的突變?nèi)后w,定時觀察植株形態(tài)、顏色等變化,可以獲得大量的植物表型參數(shù),構(gòu)建指紋圖譜。此外,還可利用IMAGING-PAM熒光系統(tǒng)對植物幼苗進(jìn)行光合特性測定,高效篩選突變單株。隨著植物生物技術(shù)和基因工程的發(fā)展,細(xì)胞遺傳操作與農(nóng)藝性狀改良顯得尤為重要。細(xì)胞遺傳操作之后導(dǎo)致農(nóng)藝性狀例如生育期,株高,葉面積,果實(shí)重量等改變,均可以通過中心服務(wù)平臺高通量表型平臺進(jìn)行分析。目前,平臺已針對小麥、水稻、玉米、黃瓜、番茄、辣椒、楊樹、丹參、擬南芥、煙草、蕎麥等多種植物進(jìn)行表型服務(wù),服務(wù)內(nèi)容涉及脅迫生理,生長模型構(gòu)建、生長勢評價等領(lǐng)域。

如您需要了解更多信息,請識別下方二維碼填寫登記表,我們會為您提供專業(yè)的服務(wù),真誠期待與您的合作!

電話:021-32555118

郵箱:sales@zealquest.com

相關(guān)閱讀:
Speed Breeding:加速作物研究和育種的強(qiáng)大工具
中國團(tuán)隊(duì)利用合成生物學(xué)手段成功創(chuàng)制高油脂水稻種質(zhì)
SpeedFlower:秈稻和粳稻的綜合快速育種方案


收 藏