AIくずし字認識アプリを作った源氏物語ファンのタイ人女性「日本の研究者にバカにされてつれぇわ」 [788192358]

AIくずし字認識アプリを作った源氏物語ファンのタイ人女性「日本の研究者にバカにされてつれぇわ」 [788192358]

1 ::2021/10/11(月) 13:00:59.33 ID:YDhvmomo0●.net ?2BP(10000)
https://img.5ch.net/ico/999991500948725.gif
2021 10 07 THU

ビデオ会議の背景は『源氏物語絵巻』。気さくで明るい人柄だが、古典のくずし字が読まれない日本の現状には不満をあらわにする。彼女からは古典文学が「好き」という気持ちがあふれ出していた。

タリンさんはタイの首都・バンコク出身。日本の古典文学に魅了され、大学院進学とともに1人で来日した。大学院での専攻は『源氏物語』の古注釈ながら、古典文学の魅力を少しでも多くの人に伝えるために、AI(人工知能)によるくずし字認識に取り組み始めた。

彼女が開発したくずし字認識スマホアプリ「みを(miwo)」はSNS上などで大きな話題になった。スマホやタブレットのカメラでくずし字資料を撮影し、ボタンを押すだけで、AIが1枚あたり数秒でくずし字を現代の文字に変換するアプリだ。精度は江戸時代の版本では約95%におよぶ。

彼女は2021年8月31日にROIS-DS人文学オープンデータ共同利用センター(CODH)、国立情報学研究所(NII)を退職し、9月6日にグーグル合同会社 AI開発部門 Brainチームのリサーチ・サイエンティストとして入社した。

(中略)

「『AIによるくずし字認識は望ましくない』『こんな研究は良くない』という国文学研究者が何人かいました。古典文学を広めようと頑張っているのに、自分が所属する分野の人たちに反対されるのはつらいです」

開発中に何度も沈んだ気持ちになった。それでも、くじけそうな気持ちより古典文学が「好き」という想いと、その魅力があまり伝わっていない日本の現状を変えたいという気持ちのほうが勝った。

「SNS上で高校の教育に古文・漢文は必要ないという意見をよく目にします。だけど、高校のときに古文・漢文が必要ないと言ったら、人生でいつ勉強するんですか。大抵の日本人は大学に入ったら、古文・漢文に触らなくなります。本屋さんには古典文学の本はたくさん売っていますが、古典文学、とくに原文を読もうとする人は少ないのではないでしょうか?」

気さくで笑顔が絶えない彼女の顔がちょっとだけ曇った。日本にはこんなに良い古典がたくさんある。古典を忘れないで。古文・漢文を勉強して。国内外の講演でいつもそう訴えている。古典文学への想いがあふれ出してきた。

画像・全文
https://ledge.ai/tkasasagi-interview/

240 ::2021/10/11(月) 15:03:46.71 ID:iGbEzMVZ0.net

>>5
とりあえず古文の原典はそのままではほとんど読めない
文字が読めたとしても意味が通じない
学校で習うのは学者の中でこれはもう間違いないだろうと判断された古典の中のごくごく一部

295 ::2021/10/11(月) 16:24:00.33 ID:edr40CXe0.net

>>1
単純にすごいねぇ
OCRが草書にも変体仮名にも対応したということでしょ

こういうのは外国人の日本文学研究者が意外な仕事をするのよ
彼らにとって現代日本語文字を学習するのも
変体仮名を学習するのも同じだから
ネイティブ日本語話者と異なる視点があるのよ

164 ::2021/10/11(月) 13:56:28.66 ID:dakFbG9f0.net

日本人が三国志好きなのと同じなのかな

396 ::2021/10/11(月) 20:23:32.80 ID:l9KX9l3x0.net

>>393
>>394で既に書いたが日本語の捉え方が間違えてるのよ

英語圏の上流知識人はラテン語に辿り着くしそれは母語と不可分なわけで、やまとことのはも女房詞も漢語も漢文も日本語の要素として全く不可分なわけだ

江戸時代の穢多非人や百姓や武士の子供は最初に文字を習ったか?
なぜ子供にはわかりえない素読させたかってのと結びつくが文字を読み取ることが重要なわけじゃあないわけでね

博物館で読めもしない王羲之の書をボケーッと眺めてる、「意味を理解しようとしない」間抜けな現代日本人には相応しいアプリかもしれないけども

284 ::2021/10/11(月) 16:06:52.73 ID:w7qA6qMEO.net

この手の金にならない分野の研究者なんて
世捨て人みたいなもんだから、新しい手法とか新参者を
警戒し毛嫌いするんでしょうね

それに自分(専門家)でなければ読めなかったモノが
機械で読める様になると、自分の存在も危うくなる訳ですし

545 ::2021/10/12(火) 19:57:51.14 ID:VXIqAQa10.net

松葉くずし承っちゃいました 浜美波

310 ::2021/10/11(月) 16:58:56.41 ID:NoqcbQsG0.net

>>6
いわゆるAIに仕事奪われる状態になるからだろうなー

271 ::2021/10/11(月) 15:33:04.02 ID:95XVUDDY0.net

>>270
今のビッグテックの検閲知っててそう思うのか?

260 ::2021/10/11(月) 15:23:17.01 ID:Kimk9fzH0.net

>>259
格差があるから平仮名やカタカナは生まれたわけではない
変なこと言ってるのはお前

539 ::2021/10/12(火) 18:51:00.14 ID:Ikpq3GE30.net

>>503
チョン語にはくずし字の古典がなくていいよなあw
でも、古い漢字の書は誰も読めないんだっけかw

458 ::2021/10/11(月) 22:26:26.24 ID:iGbEzMVZ0.net

実際には江戸時代の整版板本でも8割くらいしか正しく読めないらしい
8割読めればいいと言うかもしれないが研究に使おうと思えば結局人力で修正しないといけない
江戸時代の板本で翻字されてないのはたくさんあるからもっと正確になれば
例えば語彙研究とかではすごく役に立つんだけどまだそのレベルではない
そして学者と学生で変体仮名を読むスキルが乖離しているので
このスキルがないと学者にはなれない以上AIに頼るなと指導するのは故なきことではない
一般の人はどうぞお使いくださいだが遊び程度にしかまだ使えない

288 ::2021/10/11(月) 16:11:03.83 ID:qp+snNxa0.net

くずし字が読める学者が自分の地位を奪われると思って反対してるんだろ
地位や権威だけをみて人の判断基準にする奴がいるからな
学術会議なんてまさにそれだろ

250 ::2021/10/11(月) 15:14:25.11 ID:Kimk9fzH0.net

>>248
それ平仮名の成り立ちと関係ないじゃん

278 ::2021/10/11(月) 15:51:31.83 ID:6uF0hZW/0.net

>>7
おまえエラそう
エラ張ってるだろ
韓国人だな

85 ::2021/10/11(月) 13:20:59.21 ID:C/03w7A10.net

望ましくない理由て何よ?

66 ::2021/10/11(月) 13:16:05.09 ID:80UZbOPY0.net

その学者の名前出せ。見解が聞きたい。

303 ::2021/10/11(月) 16:39:09.26 ID:DJ/Ip+XQ0.net

グラフ理論とか使うんだよね

471 ::2021/10/12(火) 02:14:53.98 ID:EK4c6soY0.net

>>50
社会に出たことがない理系の学者も相当なもんですわ

354 ::2021/10/11(月) 18:36:51.37 ID:jJcWIWCE0.net

>>348
それはおまえの方だよチョン

370 ::2021/10/11(月) 19:02:49.72 ID:6FonubZd0.net

解釈変わることもあるし、俺も変体仮名は自分で読んだ方がいいと思うけど元の字が何だとか、いつく候補があるとか、そこまでならAI使った方が早いな、と思う

553 ::2021/10/12(火) 22:07:52.59 ID:/1ydon4F0.net

>>7
この人古文書とか普通に読める

444 ::2021/10/11(月) 21:07:03.92 ID:4tr42Ren0.net

>>388
いるね。それを踏まえて擁護になってないと言ったのです

72 ::2021/10/11(月) 13:17:45.38 ID:tbAtia5d0.net

>>1
>『AIによるくずし字認識は望ましくない』『こんな研究は良くない』という国文学研究者が何人かいました。

なんで?

26 ::2021/10/11(月) 13:07:42.86 ID:JFh8o0ll0.net

>>15
それをAIはどうして読めるんだよ…

29 ::2021/10/11(月) 13:08:13.44 ID:WdH8jLEb0.net

研究者が批判を気にしてちゃ持たないぞ

331 ::2021/10/11(月) 17:49:52.00 ID:jTLHI+dV0.net

学者は自分の仕事が無くなる心配しているんだろw

534 ::2021/10/12(火) 17:45:05.18 ID:f3OONdUK0.net

>>533
文字なんて読めてナンボだよな。

280 ::2021/10/11(月) 15:57:59.63 ID:2dbhDpsL0.net

>>277
「クズ」だの「老害」だの「お仕事なくなっちゃいますもんねw」だの
自分のことは棚に上げて、これだから悪意の塊は・・・

285 ::2021/10/11(月) 16:07:50.17 ID:olbd9jv30.net

どこの学術会議だよ。

76 ::2021/10/11(月) 13:19:09.42 ID:PfvwGdw80.net

インストールしてみたけどほんと凄いわ

244 ::2021/10/11(月) 15:08:58.92 ID:/2XX4w200.net

>>232
身分で書き言葉が違うとか
文系はヒエログリフの時代から
進歩してないんだな…

450 ::2021/10/11(月) 21:30:32.32 ID:1lcwK25x0.net

>>449
そんなこたぁ無いよw
デジタル化・DB化も進めばむしろ研究が進む

60 ::2021/10/11(月) 13:14:40.10 ID:D+FtCg4d0.net

無能クソ老害が足引っ張ってんのかよ
こういうのが普及したら家にある古文書や資料館でも未調査のものから発見とかあるかもしれないのに

380 ::2021/10/11(月) 19:32:46.83 ID:MHdmnjdv0.net

>>369
お経には意味がない

274 ::2021/10/11(月) 15:41:39.36 ID:O1z6LyMx0.net

>>103
むしろ自分たちが馬鹿にされたとか思ってそうだなこれ

222 ::2021/10/11(月) 14:50:43.91 ID:3YsSt4xC0.net

>>104
普通の家にも崩し字の文章があったりする
お前の実家にもあるかもよ

195 ::2021/10/11(月) 14:11:27.34 ID:24yhB1Yf0.net

>>6
文系学者の飯の種が無くなるから

220 ::2021/10/11(月) 14:45:32.76 ID:1pPEi1v70.net

これは日本の学者がコテンパンにやられたな

353 ::2021/10/11(月) 18:36:14.40 ID:jJcWIWCE0.net

ちょっと日本人の古典研究者の擁護をさせてもらうと、
日本の古典研究者は、古典が読めるとか読めないというレベルは研究以前のことだと考えてる。
もちろん、AIで読めるようにするのが悪いわけじゃないが、古典の研究はAIではできないことが多い。
この文書は誰がいつどういう状況で書いたものかとか、古典に出てきたこの人物はどの家系の人かを調べて、
当時の貴族階級の家どうしの関係を調べるとかだ。

中国から持ってきた古代の書なら、誰が書いた書体はこうで、別の人が書いた書体と書き方の違いなどを研究している。

かなの書なら、誰が書いたものかから始めて、書きぶりの違いや、どういう筆運びをしたかを研究してる。
誰が書いたかわからないかな書もあるので、それを調べている研究者もいる。

129 ::2021/10/11(月) 13:40:20.56 ID:LAZsLd2p0.net

>>113
学術会議の奴らじゃないの?

477 ::2021/10/12(火) 03:12:00.99 ID:ZCi884rz0.net

AKずしって何かと思った(´・ω・`)

309 ::2021/10/11(月) 16:57:47.28 ID:TybyTX1u0.net

>>294
まはりくまはりたやんばるやんやんやん

572 ::2021/10/13(水) 06:33:37.37 ID:l7eq//gp0.net

江戸期が草書ばかりとは限らないわけだが
暁鐘成『偶言三歳知恵』1825年

英泉『枕文庫』(1822-1832年頃

アルファベットとアラビア数字を使ってないだけ

241 ::2021/10/11(月) 15:06:06.29 ID:6eyeg9U60.net

き、機械がオラ達の仕事を奪っていくずら
こんなの許されるワケがないずら

282 ::2021/10/11(月) 16:00:42.94 ID:TybyTX1u0.net

>>280
たかだか翻訳を叩くクソ共のほうが
よほど悪意と害意の塊だろ

344 ::2021/10/11(月) 18:16:22.14 ID:RmA7mdXO0.net

崩し字って憧れたけどルールが分からん

114 ::2021/10/11(月) 13:31:24.22 ID:sBwEeDNV0.net

>>26
前後の文字のつながり、文節の位置、とかじゃないの?
AIのキモは学習による精度だし

538 ::2021/10/12(火) 18:30:08.22 ID:WXUchF5j0.net

>>532
学会全体が一枚岩な所なんてないだろw
研究者と一口に言っても色々な立場を取る人がいるのが普通だと思うんだが
どんな分野にでも足引っ張る奴はいる

438 ::2021/10/11(月) 21:00:51.56 ID:MnveRX7D0.net

習字を習ってたから多少は読めるけど、
〜〜みたいな字とか、旧字を崩されてるとこは無理なんよね
知らない漢字は崩されたら読めん

こういうアプリは素晴らしい。
日本人は精度100%とか目指そうとするからなかなか出来ないんだよね

よろしければフォローして下さい!

コメントを残す