2016/11/19

ノー読解力

人工知能(AI)に学習させて東大合格を目指していて「東ロボくん」が、東大合格というゴールをあきらめたようなのだ。
センター試験の問題を解かせると、数学や物理では高得点、世界史などではそこそこの得点がとれるんだけど、国語と英語がダメで、プロジェクト期間内では合格水準に達することはできない、と判断されたみたい。
最近はAIが将棋やチェスで名人を打ち負かしたりしているけど、受験勉強ではまだまだのようなのだ。
でも、どうもこれには構造的な問題があるようなんだよね。

研究者のひとたちが分析した結果、国語や英語でいい点が取れないのは、主に「読解力がないから」というのが理由みたい。
基本的にAIの場合は、問題文の中の単語の羅列をパターン化して、こういう単語が並んでいる場合はこういう問題だから、これが答えになるはず、と膨大なデータを検索しつつ推測しているんだよね。
でも、これは文章の意味を理解しているわけじゃないので、微妙な表現の違いで全く異なることを聞いてくることがある国語や英語の問題には十分に対応できないようなのだ。
逆に、数学や物理なんかは問題がパターン化しやすいので高得点がとれ、選択式の世界史も多くの場合問題がパターン化できるので答えられるみたい。

さらに、ここで研究者の人たちが気づいた点があったんだよね。
確かにAIは国語や英語の点数は高くないのだけど、それでも偏差値でいうと45くらいあって、点でダメというわけではなく、平均よりちょっとしたくらい、というもの。
そうだとすると、ひょっとして、普通に試験を受けている子供の中にも実は問題文の意味が理解できていない子供がいるんじゃないか、と考えついたわけ。
そこで、このプロジェクトの研究者たちは、小学生を対象にきちんと文章が読めているのかどうかを調査する、読解力テスト(リーディング・スキル・テスト)というのをやってみたらしいんだ。
すると、やはりパターン認識はできていても、文章の意味を正確にできていない子供がいるということがわかってきたんだって!
これは驚き。
知識を問う問題ならパターン認識で対応できるけど、文章の意味を理解して、それに的確な答えを出さなくちゃいけない問題は解けないということなのだ。
今度は調査範囲をもっと広げて、どうやったら読解力を上げるような学習ができるのかを含め、深掘りをしていくようだよ。

たまに話がなかなか伝わらない人がいるけど、実はこういうこと?
一部の知的障害を持った人たちも、パターン化された言語・行動は認識できるけど、そうでないものを知覚するとパニックを起こすことが知られているよね。
実はそういう現象は白黒はっきりと教会が分かれているわけじゃなくて、こういう「読解力がない」、「空気が読めない」みたいなものも含めてグラデーションになっているのかも、と思ったよ。
なので「よく読めばわかるでしょ」と言っても、相手はそれを読んでも正確に意味が理解できるとは限らないのだ・・・。
これは早急に「読解力」を養う学習法を確立したいね。

で、同じような話は、自動翻訳の世界でもあるのだ。
最近、googleの自動翻訳の精度が上がったと話題になっているけど、これはニューラルネット技術の導入によるものなんだて。
それだと意味がわからないけど(笑)、平たく言うと、これまは単語ごとに適当な訳語をあてがって訳していたんだけど、新たなシステムでは、文章全体を読み込んだ上で訳語をあてているようなのだ。
機械は文章の意味は理解できないんだけど、こういうパターンで単語が並ぶ文章の場合はこういう訳されている場合が多い、という情報が付け加わることで、とんちんかんな訳語がはめられなくなるのだ。
これで相当精度が上がるみたいなんだよね。
英語の場合、runとっかtakeとかhaveとかって多様な意味を持っているけど、文章の流れのパターン認識によってどういう意味で使われているのかがある程度推測できるというわけ。
前のシステムだと、本来「経営する」の意味で使われていた「run」に「走る」という訳語を当ててしまったりもしたわけだけど、こういうのがなくなるということだよ。

googleのディープ・ラーニングによる機械翻訳はそうやって進化しているわけだけど、これもパターン認識を精緻化しているだけで、文章の意味を理解しているわけではないんだよね。
そこはやはり機械では無理なのだ。
でも、最近お仕事で仏語で送られてきた文書をgoogleで英語に翻訳したらかなりきれいな、意味の取った英語が出てきたので驚いたんだよね。
ひょっとしたら、人間でもどうしても読解力が向上しない人は、こういう訓練が必要なのかも・・・。
機械と違って無尽蔵のデータベースを検索できるわけじゃないから、難しいけど。
でも、外国語は話せなくても、相手の声の調子や顔色を見て適当にごまかすなんてことはやっているわけで、それくらいならできるはずなんだよね。

0 件のコメント: