非奇異矩陣提示您:看後求收藏(快眼看書www.kyks.tw),接著再看更方便。

學了9個學時,就被要求一個暑假裡手擼一個影象識別演算法的高材生,他有他自己的想法。

他要用強化學習。

“對於強化學習而言,我們的樣本太少了。”哪裡都要摻一腳的鄭K一如既往地苦著臉說。

“少就少唄,又不是不能用。再說了,我們不是正在用老鼠造模嗎?造完了樣本就多了。”盧赫不以為然。

“具體思路呢?”鄭K憂心忡忡地問。

“跟你們一樣。特徵是某時間點的基因組,標籤是未來的突變位點,然後讓單鹼基編輯的載著相應嚮導RNA的cRISpR系統在那裡等著,一旦突變了,就立刻給修復。把病扼殺在搖籃裡。

非要說有什麼不同,第一,我這是黑箱,只能發揮作用,卻不知道怎麼發揮作用;第二,我這基本算是端到端的、全自動的,人工干預只在定期查基因組和設計cRISpR系統,這部分工作未來也有希望自動化。

功過相抵,中規中矩。”

散會後,盧赫坐到電腦跟前,摩拳擦掌。

雖然不是專業人士,但一直跟進這方面進展的他,始終覺得那些在數年間如雨後春筍般湧現出來的大幾十種方法裡,強化學習最有前途。

因為這是最接近人類本能學習方式的一種。

它的原理也很簡單,就是讓懵懂的小人工智障在環境裡學習,它的每個動作都對應一個獎勵或者懲罰。

就像還在蹣跚學步的小時候的我們一樣,我們看到了火,好奇心趨勢我們走近,我們感受到了溫暖,獎勵加一;手賤去摸了一下被燙到,懲罰加一。

於是,聰明的我們就會知道,火很暖和但不能靠得太近。

只不過與人不同得是,小人工智障無法一次就學會,而是需要大量資料去支撐它在環境裡反覆探索,直到把自己訓練成人工智慧。

如果用玩超級瑪麗來打比方,小人工智障在遊戲的第一幀獲得初始狀態;

在此基礎上,我們可以逼迫它往前走一步,不論前方是不是有蘑菇怪。這樣它會主動做出第一個行動。

這時,它所處的環境發生了變化,獲得了新的狀態;

同時,根據它死沒死,環境會給它一個獎勵或懲罰。

如此迴圈下去,便得到了一個由狀態、行動和獎勵組成的序列。小人工智障的目標就是調整自己的狀態和行動,以使獎勵的期望值最大。

如果訓練的順利,它便有望進化為一命通關的人工智慧外掛

歷史軍事推薦閱讀 More+
我就抓個兔子,全屬性都翻倍了

我就抓個兔子,全屬性都翻倍了

遊園驚夢
【廢土+系統+熱血】 荒野獵手陳小河抓了一隻兔子,意外獲得了黑球系統,讓自己的屬性翻倍。系統還可以不斷升級,獲得更多新奇的功能。 就在陳小河覺得自己穩了,吊打其他超凡者,成為廢土之王的時候,竟然發現這個廢土世界並不是那麼簡單,變異的原因來自異界的能量流入,這個世界危在旦夕。 陳小河:我又不是救世主,關我屁事,誰行誰上。 黑球系統:來自異界的能量可以讓我們更快升級。 陳小河:反攻異界,拯救世界,我
歷史 連載 180萬字
地球第一領主

地球第一領主

十曜
領主、氣運、種田、爭霸。英雄,王朝、歷史、神話。諸天破碎,萬界合一演化“永恆之地”。因為,地球所在宇宙極為浩瀚,人類又為宇宙唯一智慧種族。因而,全都獲得了特權..
歷史 連載 335萬字