So-net無料ブログ作成
前の10件 | -

コンピュータ・サイエンスにみる学びの多様性 [学問]

 最近、文春新書から「知立国家 イスラエル」(米山伸郎著)という題名の新書が出版されて、大変興味深く読ませていただいたが、その中で特に気になった箇所があった。今の日本のコンピュータ・サイエンスの現状をそのまま表している数字のように思えた。「コンピュータ・サイエンスで有名な世界の大学のトップ30の中に、イスラエルの大学が4校も入っているのに対して、日本の大学は一つも入っていない。


 これは最近の世界の大学ランキングで日本の最高学府である東大が40番台の前半であるのを考えると、そんなに驚く様な数字ではないのかもしれないが、21世紀のこれからの将来展望を考えた時、日本産業にとっては切実な問題になってくるように思われる。ちなみにイスラエルでは16歳から選抜される軍関係のトップ頭脳集団「タルピオット」では、3年間かけて高等数学、物理学、コンピュータ・サイエンスの3学科を徹底的に叩き込まれるようだ。(日本の大学で4年かけて1科目を専攻するのを3年間で3科目やってしまう。)中でも、コンピュータ・サイエンスは国策として最も力を入れている分野でもあるらしい。


 そもそも日本にはコンピュータ・サイエンス学科や学部というものは基本的には存在しない。東大や京大にもない。あるのは工学部の中に、「情報ナンチャラ学科」みたいなものしかない。前にも書いたが、多くの日本人はコンピュータはサイエンスだとは思っていないので(注)、まず「コンピュータ・サイエンス」という言葉自体にかなりの抵抗がある。そしてやっている事はといえば、そのほとんどがハードウエアに関係する事が中心だ。思うに21世紀のコンピュータ・サイエンスでは7〜8割くらいがソフトウエアに関係するものになると思う。cognitive computing用の新しいハードウエアももちろん必要になってくるが、それもソフトウエアがあってのハードウエアだと思う。


 今のままの状態だったら、これからのAI時代、本物のコンピュータ・サイエンスを学びたい人は海外のWASP系の大学やイスラエルの大学に留学した方がいいのかもしれない。学びの多様性という意味では、ビルゲイツもマーク・ザッカーバーグもIT関連で成功している人の多くは、高校時代に学校にも行かないでプログラミングに熱中し、大学では起業して中退している。逆にラリーペイジやセルゲイブリンのようにコンピュータ・サイエンスの名門校で大学院まで進学して勉強したような人達もいる。ハーバードの数学科に入るような人も小中学校で飛び級した人とか数学オリンピックでメダルを取った人達とかで、少なくともSAT(日本の大学受験に相当するもの)の点数で選んでいるような人はほとんどいないと思う。


 現在の日本の大学受験にはコンピュータ・サイエンスはない。数学はというと、線型代数は2行2列の行列止まりで行列式のレベルにも行っていない。ベクトルは内積止まりでベクトル解析はまだ先の先。微積分は変数分離止まりで線形微分方程式にさえも行っていない。確率は条件付き確率止まりで、現在のベイズ全盛期に全く対応できていない。物理はといえば、力学は微積を使わないで力関係の図を描いて代数に当てはめるような、もう中学でやったらいいようなレベルのことを今だにやっているし(17世紀にニュートンが微積を使って力学を完成させたレベルにすら行っていない)、電磁気は、マクスウェルの方程式も知らないで、受動素子だけの交流の回路の問題や、直流のコンデンサの開け閉めのようなくだらない問題をやっている。


 20世紀はそれでも工学部で猫も杓子も電子回路さえ作っていればよかった時代には、皆が一律に全く同じ学びをしていればよかったのかもしれない。しかし、21世紀の時代には全くそぐわない内容になってしまっていると思うのは私だけだろうか?イスラエルの国家戦略(目的)はただ一つで、それは「生存」するということ。前にも書いたがユダヤ人は全ての点において日本人とは真逆の特性を持っている。その彼らが「生存」を第一の戦略としてあげているという事は、逆に言えば、世界で一番すぐに滅びてしまう可能性があるのが日本ということになってしまう。上記日本の大学受験の内容が陳腐化してしまった時、学びの多様性のない日本はあっというまに陳腐化してしまうかもしれない。


(注)欧米のコンピュータ・サイエンスの理想形は、おそらく、サイエンス、工学(エンジニアリング)、数学の3つが三位一体となったような形をしていると思う。


51uY3jzQhyL__SX314_BO1,204,203,200cut_.jpg


by チイ

nice!(0)  コメント(0) 
共通テーマ:学問

中里真由美ピアノ・リサイタル [コンサート]

171202リサイタル_チラシ表_A4_cut.jpg

171202リサイタル_チラシ裏_A4_cut.jpg


by 中里真由美

nice!(0)  コメント(0) 
共通テーマ:音楽

アルマドイチャーちゃんのアクティブラーニング [音楽]

 今話題のイギリスの音楽の天才少女、アルマドイチャー(Alma Deutscher)ちゃんを御存じですか?彼女は、ボーカル、ピアノ、ヴァイオリン、即興演奏、作曲となんでもこなします。学校には2日しか行ってないそうです。音楽の勉強もピアノの教則本や楽典などの標準的な教材は一切使わないで、はじめから作曲と即興演奏だけのアクティブラーニングをやってきたそうです。今世界の教育の流れは、小学校のDAY1からアクティブラーニングをやるというのがベストプラクティスだそうです。


 最近、MITのメディアラボの所長のJoi Ito(伊藤穣一)の書いた「9プリンシプルズ〜加速する未来で勝ち残るために〜」という本の第6章「理論より実践」という章で、「教育より学習」という内容で、現在のアメリカはこのままだと2つの学校制度ができてしまうようだ。貧しい学校はテストに合わせて指導し、標準カリキュラムで高得点を取ることを目指す。(サービス職向けの人材。)一方で金持ち学校は、問題解決、イノベーション、新知識生産に必要な技能を身につける。(グローバルシステムの中で成功する人材。)


 今の日本の教育は上記アメリカの教育の黒人やヒスパニックの貧しい学校で行っていることと同じことをやっているわけだから、グローバルシステムの中でどんどん競争力が落ちていくのは当たり前のような気がする。9つのPrinciplesにメディアラボの評価を全てAとした場合の日本の相対評価を私なりにしてみた。(A,B,Cの3段階評価)Aは結局なかった。Cが特に悪いということ。


1.権威より創発     C

2.プッシュよりプル   B

3.地図よりコンパス   B

4.安全よりリスク    C

5.従うより不服従    C

6.理論より実践     B

7.能力より多様性    C

8.強さより回復力    B

9.モノよりシステム   C


 彼女の曲や演奏はYouTubeで検索するといくらでも聴くことができます。興味がある方は、色々と聴いてみてください。






by チイ

nice!(0)  コメント(0) 
共通テーマ:音楽

楽遊会Vol.10 [コンサート]

vol10チラシ表_A4_cut.jpg

vol10チラシ裏__A4_cut.jpg


by 相聞花伝

nice!(0)  コメント(0) 
共通テーマ:音楽

DPMによるクラスタリングの実験 [学問]

 書籍「続・わかりやすいパターン認識」の第12章のディリクレ過程混合モデル(DPM)によるクラスタリング(ノンパラメトリックベイズ)の実験を、実際にpythonで実装して確認してみました。書籍では2種類のクラスタリング法の実験を行っていますが、今回はパラメータ推定も伴うクラスタリング法1の難しそうな方を行ってみました。前回の凸クラスタリング法もクラスタ数を推定する手法でしたが、ノンパラメトリックベイズはそのクラスタ数の推定を数学的にもっと美しくできるようにしたものです。ノンパラメトリックベイズとは、パラメータが無いということではなくて、「無限個のモデルを想定した無限個のパラメータを持ち得るベイズモデルの総称」のことです。


 初期状態は全ての500個の点がクラスタ0に所属する状態(c = 1)から始めています。その他ハイパーパラメータの値(式(12.33)と式(12.34))などは全て書籍のものに合わせて行っています。アルゴリズムはp260~261のStep1~Step5の「クラスタリング法1のアルゴリズム」に従ってpythonで実装してあります。


 ノンパラメトリックベイズではこれまでのクラスタリング法と違って、「サンプリング」という手法が用いられています。一つ目がp259の式(12.14)(下段の積分は、p269の式(12.35)で行います)で、sk=ωi(i=1~c)とsk=ωnewの事後確率からskを「確率的に」決定します。私はここは、pythonのnumpy.random.uniform()を使って行っています。二番目が、p259の式(12.15)(実際の計算は、p269の式(12.37)を用いて計算する)で、事後分布からc個のクラスタのパラメータθi(i=1~c)を「確率的に」決定します。具体的には、p269の式(12.37)の正規ーウィッシャート分布からサンプリングしたθi=(μi, Λi-1)を求めることになります。まず、ウィッシャート分布のΛiをW(Λi; νc, Sq)(ここで、νcは式(12.42)から、Sqは式(12.38)で計算する)からサンプリングします。私はここは、pythonのscipy.stats.wishart()を使って行いました。このサンプリングしたΛiで式(12.41)からΛcを計算して、N(μi; μc, Λc-1)(ここで、μcは式(12.40)で計算する)からμiをサンプリングします。私はここは、pythonのscipy.stats.multivariate_normal()を使って行いました。


 p261の式(12.16)のv(事後確率)の対数を取ったlogvの繰り返し数に対する変化を下図の「事後確率の変化」に示してあります。図中、logvが最大値となる繰り返し数の位置を赤の波線で示してあります。この時、s = {51, 199, 100, 100, 50}になりました(最下段のiter=89の図に相当)。またその右の「クラスタ数の変化」が、クラスタ数の繰り返し回数に対する変化を示した図になります。求めるc(クラスタ数)は図中で赤の波線で示した位置になり、その時c = 5の結果になりました。


 クラスタリングの結果を、iter=4,45,89について示してあります。クラスタリングされた点は、クラスタごとに違った形の違った色で示してあります。分布の輪郭線は、p261のStep3から確率的に決定したθi=(μi, Λi-1)を使って描いています。最後のiter=89は、logvのグラフでlogvが最大値となる繰り返し数で、図中で赤の波線で示してあります。その時のc(クラスタ数)=5になります。(クラスタ数のグラフの赤の波線のクラスタ数)

initial_cut.png

   推定する共分散行列の分布


q_error_cut.pngc_number_cut.png


      事後確率の変化            クラスタ数の変化


fig1_cut.pngfig2_cut.png

          iter = 4(途中段階)         iter = 45(途中段階)

fig3_cut.png

      iter = 89(logvが最大)


by チイ


nice!(0)  コメント(0)  トラックバック(0) 
共通テーマ:学問

AI時代の中高部活動のあり方 [社会]

 最近は、中高もほとんどの学校が週休2日制になって、個人の自由な時間が増えた一方で、週末の過ごし方次第で若者の将来が決まってしまう様な状況にもあると思う。地方の進学校のような所でも、特に体育会系の部活などは、制限が無いと週末丸々運動部活に費やしてしまって、その疲れで週5日の授業は寝て過ごすみたいな生活パターンになってしまうと悲惨だ。

 高度経済成長の時代は、例えば東大野球部出身者のような人で、大手企業の製造部長みたいな人を束ねてグイグイ引っ張って行くようなタイプの人は、勉強しかしてこなかった青びょうたんよりも重宝されるような時代もあった。しかし、製造業がどんどん衰退して行くこれからの時代に、このようなタイプの人の必要性も減ってきているのは事実だと思う。

 運動部活も体を鍛える(文武両立)という意味もあると思うが、一番大きなメリットは退屈なつまらない受験勉強をだらだら時間をかけてやるよりは、時間を区切ってその時間に集中してやる方が実際には勉強もはかどって、長続きがするということだと思う。でもこれもどちらかと言うと、後ろ向きな考えだと思う。どうせ勉強するなら、最低1教科くらいは本物の学問を学ぶような機会があってもいいと思う。

 私が今強く思うのは、中高の6年間で週休2日で時間も十分にあるわけだから、AI時代に向けて6年間の部活動で1教科でいいので本当に好きな学問を大学レベルまで(力のある人は大学院のレベルまで)やってしまうような取り組があっていいと思う。中高の部活動も従来通りの文化部/運動部の区分けだけではもうオワコンだと思うし、AI時代に向けた新しい中高部活動のあり方もそろそろ模索した方がいいと思う。

 そこで思うのが、土曜日の一日を丸々これらを学ぶ授業に当てて、

 (1)コンピュータ・サイエンス

 (2)物理

 (3)数学

の3科目のどれかを6年間かけて大学の4年レベルまで(学びの遅い人は大学の一般教養課程くらいまで、速い人は大学院のレベまで)一気に学んでしまうという部活動だ。教材は全て海外のその分野の名著と言われるものを使って英語で行う。土曜日1日と水曜日の2~3時間くらいを授業に当てて、その他の日はそれぞれの学校で授業の課題(プログラミングや演習問題)をやるといった具合だ。授業はまとめて(学校を横断して)、市や県の教育機関のような所で行ってもいいのかもしれない。(あるいは定期的に学校を変えて行う。)今の時代だったら、この部活希望者の6割くらいが(1)を受講して、2割くらいが(2)と(3)を受講するような構成比が理想だろう。

 現在の加計学園の国会答弁を聞いていると、日本は本当にオワコンだなと思ってしまう。政府も文科省も両方ともオワコンだと思う。上に書いた部活動の提案ですが、本当にどこかの県が手を挙げてやってみませんか?一番お金がかからない方法で、数年後にははっきりとした成果を出すためにはこれ以上の方法はないように思います。文科省も部活動に関して従来と同じ路線しか考えていないなら、一度騙されたと思って上記の提案を後押ししてみませんか?


by チイ


nice!(0)  コメント(0)  トラックバック(0) 
共通テーマ:学校

忖度して当たり前という考え方 [社会]

 現在、森友問題や加計学園問題で、「忖度」という言葉が盛んに使われて、「忖度することは法律上は全く問題がない」とか、「忖度は世界中どこでも行われている」などと言う人もいるが、一方で、「忖度の意味」=「他人の心をおしはかること」の使われ方が異なる場合もある。

 イスラエルの政治体制は現在、一応、議会制民主主議を採用しているようだが、内部ではマルクスの共産主義の思想をそのまま引き継いだ「キブツ」=「集産主義的協同組合」というのが存在している。多くの人はマルクスの共産主義革命は、世界中の国々で実験してみたがそのほとんどがことごとく失敗したという認識を持っていると思うが、唯一マルクスのその教えを忠実に貫いて世界でただひとつだけうまくいっているのがイスラエルなのだ。

 何故、イスラエルのキブツだけがうまくいっているのかというと、昔、故糸川英夫がイスラエルのキブツを訪れた時のことを何かに書いていて、キブツではキブツ間で利害関係が衝突すると、キブツのリーダーは自分の所属するキブツになるべく利益を誘導しないように動くらしい。自分のキブツから一番遠いところに利益を持っていくように動くと言っていた。

 これは長い歴史の中でのユダヤ人の知恵なのだと思うが、このことから言えることは、キブツのリーダーが自分のキブツに所属する人達の信頼を勝ち取るためにその人たちに利益誘導をしていると、結局は旧ソ連や東欧諸国のような結果になってしまって、社会主義は成り立たないということだ。

 政治の世界でも政権与党になれば、国民の信任を得ているわけだから、自分たちの好きなようにやって何が悪いんだと居直る人もいる。会社でも社長レース競争で勝った人達は、反対派を全て排除してしまって自分たちの好き勝手やってしまって、その結果会社を潰してしまう。また自分のやった仕事の成果を、上司や社長がやったことにして、気に入ってもらって、引き上げてもらうetc。

 「忖度」という言葉ひとつ取ってみても、日本人とユダヤ人は忖度の意味が真逆の所にいる。日本人の言う意味での「忖度」は世界中のどこの国の人でもやっていて、日本人はその中でも一番上手に忖度できるという考えの中からは、将来の日本にとって良いことは何もないように思う。


by チイ

nice!(0)  コメント(0)  トラックバック(0) 
共通テーマ:blog

普遍文法 [学問]

 日経サイエンスの5月号の特集「言語学の新潮流」で、「チョムスキーを超えて〜普遍文法は存在しない」という記事が掲載されていた。普遍文法は、「人は生得的に言語習得機構、すなわち言語機能(普遍文法)を持っている」という彼の仮説で、過去半世紀近くにわたって理論言語学を支配してきた。コンピュータの発達に伴って、計算論的アプローチを好む学者たちに支持されてきた。

 普遍文法自体も、時代の要請に合わせて、当初のものから→「原理とパラメータのアプローチ」→「計算的回帰性(再帰性)」へと変遷を遂げているが、文法的雛型に単語を当てはめる能力を子供達が生得的に持っているという基本的な考え方は変わらない。普遍文法は、下記の「語用論」も導入しているが、そこでの位置付けはあくまでも文法の脇役にとどまっていた。

 近年、普遍文法に代わる新しい仮説として「用法基盤モデル」と呼ばれるものが登場している。簡単にいうと、「子供は一般的な認知能力や他者の意図を理解する能力を用いて耳にした言葉から文法カテゴリーと規則を作り上げているという見方」。子供達が社会的相互作用の中で、認知処理機構(スキーマ化、習慣化、脱文脈化、自動化、etc)や制限機構(伝達意図推論)によって構文を使う経験を積むことで言語を習得しているとする。上に書いた主従関係が逆転したものとなっている。

  言語の習得が人の新しい脳である大脳新皮質の発達と共に起こったことを考えると、言語はチョムスキーの言うようなハードウエア的なものよりももっとソフトウエア的なものだと思う。チョムスキーは偉大な学者だが、普遍文法仮説はおそらく間違っているように思う。ただ普遍文法は翻訳などの場合、コンピュータでは扱いやすいし、文の意味は理解していなくても、その文法規則にとりあえず当てはめさえすれば訳せてしまうが、一般的には変な訳になってしまう。逆に用法基盤モデルでコンピュータが言語を獲得できるようになった場合、人の子供と同じように、まずはコンピュータがその文の意味を理解できるように学習させることが不可欠になってくると思われる。

 今、全てのコンピュータ言語の中で、一番再帰的な言語といえばLISPになると思うが(LISPでは基本的には繰り返し文は存在せず、再帰で行う。)、言語処理用にLISPをもっと拡張したような言語は作れないものだろうか?(←適当に勝手なことを言っています^^;)いずれにしても、言語はチョムスキーも指摘しているように再帰性が鍵をにぎっているように思う。数年前に大川出版賞を受賞した、田中久美子氏著の「記号と再帰」という本の結語も、「人間の記号系は、再帰的な記号を自然に扱う。・・・今なお、コンピュータは再帰が苦手である。結局、コンピュータの発展は、再帰をどのように機械において扱うかという問題でありつづけるだろう。」というものだった。コンピュータが人間並みに「再帰」を扱えるようになった時、コンピュータは言語を習得していることだろう。

by  チイ

nice!(0)  コメント(0)  トラックバック(0) 
共通テーマ:学問

凸クラスタリング法の実験 [学問]

 書籍、「続:わかりやすいパターン認識」の第10章p208にある凸クラスタリング法による実験を、実際にpythonで実装して確かめてみました。凸クラスタリングのアルゴリズムは、p206のもの(式(10.36)〜(10.45))を用いています。データは、前のEMアルゴリズムに使ったものと同じものを使っています。iter = 0の初期値は、書籍のものに合わせています。凸クラスタリングには、以下の様な特徴があります。

・ クラスタ数c を未知のまま推定する(メリット)

・ 凸計画問題なので、初期条件に依存せず、大域的最適解(最大点)となる(メリット)

・ 共分散行列σが全てのクラスタで等しく、かつ等方的であるという前提(デメリット)

・パラメータσは、恣意的に決める必要があり、直感に頼るしかない(デメリット)

 凸クラスタリングの実験を、以下の2通りの方法で試してみた。式(10.32)のσ2σ=1とした。なお、p208の図10.6の途中段階のグラフは今回は煩雑になるので掲載していません。一番最後のもの(final)だけを表示してあります。



・ノーマルケース

 全ての500個の点の事前確率πiを最後まで愚直に計算した場合。iter=4000となった時点での、πi > 0.01 の条件で選別して、6個のセントロイドが抽出された。(0, 0)のクラスタが2個のセントロイドとなったので、そのセントロイドの相加平均を求めている。(相加平均を求めたクラスタのσ=1の等方的正規分布は輪郭線を太い黒で示してある。)図final_normalに示すように最終的なクラスタ数はc=5個になり、その最終的な事前確率は式(10.37)で再正規化を行ってπi= [0.396, 0.200, 0.205(注1), 0.100, 0.099] となった。真の値、[0.4, 0.2, 0.2, 0.1, 0.1] に近い値になっている。一方セントロイドPは、P[5][2] = [[-3.014, 2.960], [1.994, 4.030], [0.006, -0.013], [3.991, -2.054], [-2.009, -4.059]]となった。(図でセントロイド位置は赤点で示してある。)


・カットケース

 予め定められた閾値(0.001/samples)以下となったπiは強制的に0に設定し、収束効率の改善を図ったもの。(ここで、samplesはπ≠ 0πi個数で500から徐々に減っていくが、削除される度に式(10.37)で正規化を行っている。これに合わせて、πi = 0のfik(p206のStep2の式)に対応する行も削除されていく。)最終的にiter=4000で、12個のセントロイドが抽出された。samples=12, fik  = (12, 500)となった。(-3, 3)クラスタのセントロイドが4個、(0, 0)クラスタのセントロイドが4個、(-2, -4)クラスタのセントロイドが2個となったので、それぞれのクラスタのセントロイドの相加平均を求めた。(相加平均を求めたクラスタのσ=1の等方的正規分布は輪郭線を太い黒で示してある。)図final_cutに示すように最終的なクラスタ数はc=5個になり、その最終的な事前確率はπ= [0.395(注2),  0.199,  0.206(注2), 0.100, 0.100(注2)]となった。セントロイドPは、P[5][2] = [[-3.014, 2.960], [1.994, 4.030], [0.007, -0.011], [3.991, -2.054], [-2.008, -4.058]]となった。(図でセントロイド位置は赤点で示してある。)


(注1)(0, 0)のクラスタの2個の事前確率を足し算している。(0.1707 + 0.0340)

(注2)(-3, 3)、(0, 0)、(-2, 4)のクラスタの4個、4個、2個の事前確率をそれぞれ足し算している。

initial_cut.png

         推定する共分散行列の分布

final_normal.png  likelihood_normal.png

       final_normal                                     対数尤度(normal)

  final_cut.png likelihood_cut.png

                   final_cut                                           対数尤度(cut) 

by チイ

nice!(0)  コメント(0)  トラックバック(0) 
共通テーマ:学問
前の10件 | -