一、你有被化學(xué)結(jié)構(gòu)命名難倒過嗎?
“命名難、難命名、命難名!”是許多醫(yī)藥、化學(xué)科研工作者的一塊心病,特別是面對一些復(fù)雜的化學(xué)結(jié)構(gòu)式,如何能夠準(zhǔn)確、高效地命名是很大的難題。
市面上已有一些軟件能夠?qū)崿F(xiàn)化學(xué)結(jié)構(gòu)的英文命名,比如ChemDraw、ChemDoodle、MarvinSketch。可是ChemDraw訂閱需要高額的費(fèi)用,同時(shí)軟件銷售商也打擊該軟件的盜版。ChemDoodle無論是網(wǎng)頁端還是客戶端都需要收費(fèi),在試用條件下,諸如結(jié)構(gòu)式命名等功能無法使用。ChemAxon旗下的MarvinSketch由于秘鑰申請和安裝比較復(fù)雜,也降低了使用方便性。
▲免費(fèi)的InDraw照顧國內(nèi)科研工作者
并且,這些軟件均由國外開發(fā)商開發(fā),從軟件的用戶界面到化學(xué)結(jié)構(gòu)式命名均是英文,給國內(nèi)用戶造成了很大不便。在化學(xué)結(jié)構(gòu)式命名這塊,國內(nèi)市場可以說長期處在空白狀態(tài)。對國內(nèi)用戶而言,很長時(shí)間內(nèi)沒有一款能對化學(xué)結(jié)構(gòu)進(jìn)行IUPAC中英文命名的軟件。
InDraw的出現(xiàn)實(shí)現(xiàn)了IUPAC中文命名功能,其命名系統(tǒng)是直接基于化學(xué)結(jié)構(gòu)給出英文和中文的名稱。中文命名非基于翻譯,可以說是全球首創(chuàng)。在世界范圍內(nèi),還沒有一款科研軟件能做到基于化學(xué)結(jié)構(gòu)生成中文名稱。
二、不簡單的IUPAC中文命名
對于復(fù)雜結(jié)構(gòu)的中文命名,很早就有人想到先用ChemDraw等軟件生成化學(xué)結(jié)構(gòu)的IUPAC英文名稱,然后再利用Google翻譯將其轉(zhuǎn)化成中文名稱。
這種做法得到的中文命名正確率很低。通過翻譯得到的結(jié)果經(jīng)常會中、英文摻雜在一起,需要人工修改。不僅費(fèi)時(shí)費(fèi)力,而且又極容易出錯,導(dǎo)致中文名稱不能再還原成正確的結(jié)構(gòu)式,在中文專利知識產(chǎn)權(quán)保護(hù)上,可能會面臨專利無效的風(fēng)險(xiǎn)。
▲常見化合物的英文名稱與Google翻譯的中文名稱
IUPAC英文命名系統(tǒng)和IUPAC中文命名系統(tǒng)有諸多差異。翻譯軟件只能生搬硬套地對應(yīng),無法應(yīng)付中文命名中很多約定俗成的命名方式。
比如酚類是中文特有的命名方式,在結(jié)構(gòu)式的中文命名中,我們將連接在芳環(huán)上的羥基命名為“酚”,以“benzene-1,2,4-triol”為例,對應(yīng)的中文命名為“苯-1,2,4-三酚”,如果直接將其英文名稱用Google翻譯,則會得到“苯-1,2,4-三醇”,這顯然是錯誤的。
▲如果直接做英文轉(zhuǎn)中文的翻譯,是不正確的
這樣的例子還有很多,IUPAC英文的命名順序和中文命名也不一樣,直接翻譯也是不準(zhǔn)確的。就拿酯類物質(zhì)而言,酯命名時(shí),其中英文的順序是不同的。例如,中文“丙二酸乙基甲基酯”對應(yīng)于英文“ethyl methyl malonate”,如果拿英文直接翻譯成中文,則會得到 “乙基甲基丙二酸”,打亂了順序。
▲IUPAC英文的命名順序和中文命名不一樣
如果就這樣對化合物名稱進(jìn)行草率地翻譯,會埋下隱患。如果在做學(xué)術(shù)過程中,論文結(jié)構(gòu)名稱出現(xiàn)錯誤,會大大影響到你的學(xué)術(shù)可信度。在申請專利時(shí),如果中文專利的結(jié)構(gòu)式名稱不規(guī)范,則不利于專利審核與保護(hù)。很可能你所保護(hù)的分子結(jié)構(gòu),因?yàn)槊麊栴}被別人鉆了空子,造成損失。
科學(xué)出版社出版的《有機(jī)化合物命名原則2017》是目前有機(jī)化學(xué)結(jié)構(gòu)中文命名的權(quán)威參考。中文命名和IUPAC英文名稱有著極大差異,比如中文有機(jī)化合物名稱中組合各結(jié)構(gòu)構(gòu)成名稱時(shí),需要采用各種連綴字來表達(dá)它們之間的相互關(guān)系,這與英文中以變換字母,尤其是元音即可表達(dá)構(gòu)詞的方法是不同的。
InDraw的中文命名系統(tǒng)則是參考了這本書,其最底層的命名邏輯更契合中文的命名方式,所得到的中文名稱則更加準(zhǔn)確。同時(shí)InDraw的英文命名,也參考了權(quán)威的IUPAC 1993版、IUPAC 2013版,此外InDraw還參考了無機(jī)物1980版的命名原則,命名范圍更廣。
▲InDraw的中英文命名系統(tǒng)參考權(quán)威的命名書籍
▲相比谷歌翻譯,用InDraw直接生成化合物的中文名稱是靠譜的選擇
三、InDraw的命名功能到底強(qiáng)在哪里?
InDraw與其他命名軟件到底有何異同?由于ChemDraw、ChemDoodle、MarvinSketch只能進(jìn)行IUPAC英文命名,無法進(jìn)行中文命名,筆者將其命名結(jié)果用Google翻譯轉(zhuǎn)化成中文做中文名稱的參考。
首先來測試一下很多人在生活工作中必不可少的咖啡因分子,咖啡因是嘌呤類的物質(zhì),常被命名為 “1,3,7-三甲基黃嘌呤”,在相關(guān)的CAS號查詢平臺和百科上都可以見到這個(gè)命名。這樣命名的單體其實(shí)就是黃嘌呤了,然后再對三個(gè)甲基進(jìn)行定位,簡潔清楚。PubChem平臺給出的IUPAC英文命名是“1,3,7-trimethylpurine-2,6-dione”,將單體又細(xì)分為嘌呤了。ChemDraw、ChemDoodle、MarvinSketch、InDraw的命名單體也圍繞著嘌呤來,前兩者的命名結(jié)果是完全一樣的。
▲多種軟件對咖啡因的命名結(jié)果比較
MarvinSketch的命名結(jié)果則稍微復(fù)雜一點(diǎn),定位更多,有意思的一點(diǎn)是,將其命名結(jié)果導(dǎo)入ChemDraw和ChemDoodle的Name to Structure功能,前者無法顯示。說明兩者的命名邏輯是不一樣的,也未能很好的兼容。
InDraw對于咖啡因的命名方式類似MarvinSketch,只不過氫取代基的定位略有不同,MavrinSketch是“2,3,6,7”,而InDraw的定位是“1,2,3,6”。雜環(huán)一般是采用并環(huán)法命名,編號順序是順時(shí)針,而嘌呤是個(gè)例外,先逆時(shí)針定位完嘧啶環(huán)再定位咪唑環(huán),從命名結(jié)果上看,InDraw給出的中文命名其更加符合《有機(jī)化合物命名原則 2017》的命名順序。導(dǎo)入InDraw命名的英文名稱,另外三款軟件均能顯示出正確的咖啡因結(jié)構(gòu)式。
▲InDraw的中文命名更符合《有機(jī)化合物命名原則 2017》
當(dāng)化學(xué)結(jié)構(gòu)的復(fù)雜度提升時(shí),InDraw的命名系統(tǒng)也能輕松勝任,能夠命名ChemDraw無法命名的物質(zhì)。
▲InDraw的命名系統(tǒng)具備更廣泛的命名支持
如果將結(jié)構(gòu)的復(fù)雜度提升,換成健康殺手膽固醇呢?膽固醇是甾體類化合物,甾體結(jié)構(gòu)在自然界中大量存在,是比較典型的四環(huán)化合物,從事天然產(chǎn)物化學(xué)的研究者可能經(jīng)常與甾體結(jié)構(gòu)打交道。比較簡單的命名方式就是以甾體母核進(jìn)行命名,比如在膽甾的基礎(chǔ)上增加取代基。
▲膽固醇的命名結(jié)果比較
可以看到當(dāng)化學(xué)結(jié)構(gòu)復(fù)雜度提升時(shí),這幾款命名軟件給出的英文命名不盡相同。ChemDraw、MarvinSketch的命名邏輯基本相似,所選取的命名單體是一樣的,這也與PubChem數(shù)據(jù)庫查詢的IUPAC英文命名方式基本相似。
由于MarvinSketch有著兩套命名系統(tǒng),能同時(shí)給出結(jié)構(gòu)式的俗名和IUPAC英文名,MarvinSketch也提供了“Cholesterol”,這個(gè)命名的選項(xiàng)。ChemDoodle似乎在這方面做的不夠好,并沒有選取環(huán)戊環(huán)和菲環(huán)作為環(huán)的命名單元。而InDraw的命名類似半俗名,直接以膽甾為命名單體,與CAS查詢得到的命名邏輯一致。
再觀察Google的翻譯結(jié)果,顯然就和中文命名方式有很大的差別,比如環(huán)單元命名這塊,按照中文的命名邏輯應(yīng)該為“環(huán)戊并菲”,而Google翻譯的結(jié)果是“環(huán)戊二烯菲”,這也說明了直接翻譯IUPAC英文名稱的方式不可取。
InDraw對甾體化合物的命名做了專門的優(yōu)化,比如可以直接以膽甾、雌甾、雄甾、孕甾為命名單元進(jìn)行命名,能夠使天然產(chǎn)物的命名更為簡潔。
▲InDraw命名系統(tǒng)支持甾體類化合物的簡潔命名
比如這五種甾體結(jié)構(gòu),InDraw可以很好地識別其甾體母核,給出的命名類似我們用的半俗名,非常簡潔,而ChemDraw未能識別。
倘若再將物質(zhì)范圍擴(kuò)大、用普通有機(jī)物、螺環(huán)、橋環(huán)、氨基酸、甾體以及無機(jī)物來考驗(yàn)這四款軟件,它們的命名表現(xiàn)又將如何?
▲以這幾類化學(xué)結(jié)構(gòu)為例,來對InDraw、ChemDraw、ChemDoodle和MarvinSketch進(jìn)行對比測試
基本有機(jī)物命名的對比測試
螺環(huán)有機(jī)物命名的對比測試
橋環(huán)有機(jī)物命名的對比測試
氨基酸命名的對比測試
甾體命名的對比測試
無機(jī)物命名的對比測試
總體體驗(yàn)下來,這四款軟件差異還是很明顯的。在基礎(chǔ)有機(jī)物這塊,ChemDoodle出師不捷,5個(gè)結(jié)構(gòu)最終只能命名出2個(gè)。這幾種結(jié)構(gòu)里面含有Si、Se、Sn等在有機(jī)化學(xué)結(jié)構(gòu)內(nèi)不常見的元素,對于處理這些結(jié)構(gòu)的命名,ChemDoodle有待提升。在螺環(huán)這塊,ChemDoodle更是無法命名。在最后的無機(jī)物命名這塊,ChemDoodle也難以達(dá)到預(yù)期。
▲InDraw、ChemDraw、ChemDoodle和MarvinSketch的命名表現(xiàn)
在無機(jī)物這塊,InDraw與這三款軟件相比,有著一定優(yōu)勢。比如ChemDraw無法識別最基礎(chǔ)的二氧化氮,MarvinSketch無法識別離子化合物,只能單個(gè)給出離子的命名,不能給出整體命名,推測它只能識別共價(jià)化合物。
MarvinSketch支持俗名以及IUPAC英文命名,比如氨基酸“D-alloisoleucine(D-別異亮氨酸)”,MarvinSketch可以給出縮寫名“Hile”,同時(shí)其也支持甾體的簡潔命名。InDraw對氨基酸衍生物的處理也很到位,可以識別其中的氨基酸結(jié)構(gòu)。
▲InDraw對氨基酸衍生物的命名也很簡潔
四、結(jié)語
InDraw在化學(xué)結(jié)構(gòu)命名中效果良好,特別是直接基于化學(xué)結(jié)構(gòu)給出英文和中文的名稱,結(jié)果非常精確。與同類型的產(chǎn)品比較,其命名范圍廣、結(jié)果可靠、支持原生中文命名,對無機(jī)物命名也有很好的效果,同時(shí)支持一些天然產(chǎn)物的簡潔命名。
簡而言之,這款結(jié)構(gòu)式命名神器有著如下優(yōu)點(diǎn):
? 免費(fèi)、原生中文界面、操作方便;
? 業(yè)界首創(chuàng)的化學(xué)結(jié)構(gòu)中文命名;
? 命名范圍廣、正確率高;
? 支持天然產(chǎn)物的簡潔命名;
? 對無機(jī)物命名性能優(yōu)秀。
一鍵IUPAC中文命名,免費(fèi)試用,快來試試吧!
下載鏈接:http://www.integle.com/static/indraw
聲明:化學(xué)加刊發(fā)或者轉(zhuǎn)載此文只是出于傳遞、分享更多信息之目的,并不意味認(rèn)同其觀點(diǎn)或證實(shí)其描述。若有來源標(biāo)注錯誤或侵犯了您的合法權(quán)益,請作者持權(quán)屬證明與本網(wǎng)聯(lián)系,我們將及時(shí)更正、刪除,謝謝。 電話:18676881059,郵箱:gongjian@huaxuejia.cn