日本AI機器人Torobo-kun放棄高考計劃:閱讀理解難以逾越

        (JGospel 北京時間 2017年1月11日)2016年11月14日,人工智能係統“Torobo-kun”在東京的千代田區參加一次模擬大學入學考試,正用機械臂填寫答案2016年11月14日,人工智能係統“Torobo-kun”在東京的千代田區參加一次模擬大學入學考試,正用機械臂填寫答案
  日本國立情報學研究所(NII)的研究人員宣布,放棄讓人工智能係統“Torobo-kun”參加東京大學入學考試的計劃。作為NII開發的人工智能機器人,Torobo-kun的終極目標是通過日本頂尖高校東京大學的入學考試,而目前的研究結果表明,這一計劃遇到了難以逾越的障礙。

  儘管近年來人工智能發展迅速,特別是近期接連戰勝了多位圍棋世界冠軍,並在其他許多領域展現出驚人的能力,但在人類語言的閱讀理解能力上,人工智能的表現一直很不如人意。從2013年開始,NII的團隊就與其他機構合作,讓Torobo-kun參加模擬高考。 2016年,Torobo-kun第一次在模擬考試中獲得了成功,顯示它有80%的機率通過關東“難關私大”(非常難考的私立大學,包括明治大學、青山大學學院、立教大學、中央大學和法政大學,縮寫為MARCH)和“關關同立”四所著名私立大學(關西大學、關西學院大學、同誌社大學和立命館大學)的入學考試。這次模擬考試是由一個大型的函授教育公司主持的。

  此外,Torobo-kun還參加了由一個大型補習學校主持的模擬考試,內容是東京大學入學考試第二階段的測試,並取得了不錯的成績,在數學科中平均得分為76.2。然而,NII的研究者在2016年秋季放棄了讓Torobo-kun考入東京大學的遠大目標。 NII的Noriko Arai教授解釋道:“人工智能係統無法理解必要的信息,閱讀和理解句子含義的能力存在局限。我們發現,現在還沒有辦法使這一系統獲得足夠的分數,使它通過東京大學的入學考試。”

  從一開始,Torobo-kun在每個科目的閱讀理解測試中就表現得十分糟糕。例如,當它嘗試回答一個世界歷史問題:“誰是曹丕的父親?誰成為了中國三國時代魏國的第一位皇帝?” Torobo-kun無法給出正確的答案。儘管Torobo-kun已經知道曹丕是曹操的兒子,但它無法想到曹操就是曹丕的父親,因為它不理解父子關係。

有一個研究團隊接受了開發Torobo-kun英語語言能力的任務,他們第一次引入了所謂的“深度學習”方法,嘗試讓人工智能在涉及5到10個句子的閱讀能力測試中給出更多的正確答案。深度學習是一種創新技術,通過將大量的圖片和文本數據反复讀取到人工智能係統中,深化其學習能力。然而,Torobo-kun還是無法取得更高的分數,可能是因為數據不足。研究者因此放棄了深度學習方法。對一個想要提高通過深度學習提高答題成功率的人工智能係統來說,首先必須讀取大量的數據。

參與該項目的NTT通訊科學實驗室首席研究科學家Ryuichiro Higashinaka說:“為了通過(東京大學的)入學考試,最低要求是學習100萬套問題陳述和正確答案。準備這些數據就將耗費巨大,根本是不現實的。”

  即使在Torobo-kun放棄參加東京大學入學考試之後,許多研究者依然對人工智能的開發保持樂觀。公立函館未來大學的Hitoshi Matsubara教授及其團隊一直在開發一個能夠寫小說的人工智能係統,並希望藉此贏得一個文學獎項。他的項目還有另一個目標:通過學習已逝科幻小說家小松左京的文風和用詞,完成後者未寫完的小說《虛無迴廊》。


  “儘管目前的方法有自身局限,但我們或許能讓它接受與人類不同的學習方法,從而理解其中的含義,”Hitoshi Matsubara教授說道。

  不久前,谷歌旗下人工智能部門DeepMind開發的阿爾法狗圍棋程序戰勝了韓國棋手李世石,令世人大吃一驚。 DeepMind通過深度學習方法,讓人工智能係統閱讀數十萬條數字化的新聞,從而提高其閱讀理解能力。據報導,該公司的人工智能已經能在新聞故事的概要中,以相對較高的正確比例填入適當的名詞。

  此外,還有研究者在開發一個能在極少量數據的情況下做出正確判斷的人工智能係統,就像人類大腦在面對前所未有的情況時,能通過回憶以往的類似經歷來做出判斷。東京大學的計算機科學家Ken Sakamura 教授說:“人工智能係統在閱讀理解上的局限性並沒有那麼大,因為這一領域仍是研究的最前沿。”

        NII的Noriko Arai教授表示:“我們手裡已經有了Torobo-kun的數據,任何改進人工智能係統的嘗試都是歡迎的。”誰知道呢,在閱讀理解能力上,人工智能或許有一天就真的熟能生巧了。

        來源:新浪科技