☆今日の人気記事☆

スポンサーリンク

「AIの学習データが底をつく」’2026年問題’の衝撃度とその対策とは?

2023年9月20日

0002 名無しさん 2023/07/24(月) 07:26:17.23 ID:WT/OfQ0v0

——


0024 名無しさん 2023/07/24(月) 07:30:59.73 ID:DOoPJdyd0

2025年に一気に高齢者が増える
そのときがターニングポイント


0026 名無しさん 2023/07/24(月) 07:31:52.99 ID:/wzySTqId

AIって嘘ばっかりで自信満々に答えてくるけど
そんなAIの作った記事で溢れかえったネット記事を更に学習してポンコツになったりせんの?


0036 名無しさん 2023/07/24(月) 07:39:02.77 ID:vFna9v1R0


>>26
嘘じゃなくて質問に対してその先に続く可能性が一番高い文章がそれってだけ
AIに本当のこと言わせたいなら別で正しいことが確認された情報のデータベース用意するべき


0027 名無しさん 2023/07/24(月) 07:32:32.19 ID:vFna9v1R0

いや、データはもう要らんだろ
10年前のコーパスでも十分使い物になるし
それよりAIそのものを改良する方が大事


0028 名無しさん 2023/07/24(月) 07:33:35.74 ID:yZ7qVA1Jd

もう食い尽くしたのか
ネットの世界は広大じゃなかったのか


0032 名無しさん 2023/07/24(月) 07:35:19.47 ID:qVZeCT92M

もうすでにAIにデータセット作らせ始めてるから
AIが自分でデータセット作って学習するようになるよ


0035 名無しさん 2023/07/24(月) 07:38:12.27 ID:tTkuIXaL0

絵もテキストも動画から自動で書き起こせよ
そしたら毎日無限に供給され続けるだろ


0039 名無しさん 2023/07/24(月) 07:46:28.48 ID:/Bg0eQnm0

文字はあらゆる言語の完全翻訳が一応の到達じゃないの
データは人間が写真やら観測結果を入れ続けないと


0073 名無しさん 2023/07/24(月) 08:50:19.73 ID:hi3fdbd60


>>39
まず実直にこれを実現して欲しいもんだよな
これがさっさとできなきゃ他無理だろ
AIなんて単なる確率統計ってもうバレてんだから妄想や煽りはうんざりだわ


0041 名無しさん 2023/07/24(月) 07:48:18.05 ID:lH2+2NI50

AIが自分で創作して学習しなかったら、何のためのAIだよ
人工無能かよ


0045 名無しさん 2023/07/24(月) 07:53:43.64 ID:0iU0IxU2d

将棋みたいにシンプルな正解があれば独学に意味があるがそうでないものはAIでは判断がつかない


0046 名無しさん 2023/07/24(月) 07:54:35.58 ID:jeja1T3y0

淫夢のデータもちゃんと学習しろよ


0047 名無しさん 2023/07/24(月) 07:54:36.85 ID:pwMg6wch0

嫌儲というネットの知の集合体があるだろ


0051 名無しさん 2023/07/24(月) 08:04:08.24 ID:5/649Ghv0

一度抜いたオカズでは抜けないってこと?


0052 名無しさん 2023/07/24(月) 08:04:37.39 ID:snyj66OO0

広告見てる人にカネ払え

AIの素材になってる人にカネ払え


0053 名無しさん 2023/07/24(月) 08:05:26.18 ID:8oH687/P0

これChatGPTの元アルゴリズムを開発したサイエンティストが指摘した、AIの生成データ氾濫による虚偽情報の跳梁跋扈の別側面の問題だね


0056 名無しさん 2023/07/24(月) 08:08:37.31 ID:cWo8zfUmM

動画を一コマ一コマ学習してないし話し言葉をすべて学習していない
杞憂


0057 名無しさん 2023/07/24(月) 08:10:26.09 ID:vKcw2bPjM

AI画像生成は学習先を取捨選択して絵のレベルを上げてるから
そんな風にして賢くしていくんじゃないのか


0061 名無しさん 2023/07/24(月) 08:18:46.06 ID:XxrHMYesa

人間ですら漫画家とかだんだん絵が変になっていくからな


0064 名無しさん 2023/07/24(月) 08:23:00.51 ID:qa9KbPWr0

AI制御のロボットにカメラとマイク載せて町に繰り出せばいいじゃない?
リアルタイムで人と会話して


0066 名無しさん 2023/07/24(月) 08:25:44.57 ID:8oH687/P0

HowではなくMay beの話をするのがニセ科学批判クラスタの特徴


0067 名無しさん 2023/07/24(月) 08:27:49.78 ID:fV+YK8xP0

その内にAIが作り出したデータで埋まって
異常学習が始まるよ


0071 名無しさん 2023/07/24(月) 08:40:15.18 ID:5nh7DVe70

書籍や新聞紙を裁断して電子化する求人がはかどるな
暇をもて余してる中国の若者にやらせよう


0074 名無しさん 2023/07/24(月) 08:57:46.88 ID:CV8TKXiT0

人間は大したデータ量に触れずに高度な学習が出来るけど
なにが違うんだろうな


0081 名無しさん 2023/07/24(月) 09:46:11.71 ID:fJd/PmKG0

人類が今まで掛かってやっと蓄えた知識としてのテキスト量が
このたった数年で教師データーとして消費され尽くして
やっと今のレベルなのにこれより先どうやって
今まで以上の「教師データー」を用意するのかw
人間が用意が間に合わなくなれば
機械自体に自己(経験)学習させる事が求められるけど
それは可能なのか仮にそれが可能だとして
それまで機械任せにするとどこまで人類が制御できるのか?
そろそろ壁が見えて来てるよね


0082 名無しさん 2023/07/24(月) 09:46:48.72 ID:lH2+2NI50

メタよりもARグラスだよね


0083 名無しさん 2023/07/24(月) 09:47:46.79 ID:W5G1FjvCH

ソースはネットだからあんなア○なのか…


0084 名無しさん 2023/07/24(月) 09:52:34.85 ID:IC6fJccc0

十分だろ


0092 名無しさん 2023/07/24(月) 11:07:11.08 ID:Cg4pHfiP0

> 高品質言語データとはウィキペディアやニュース記事、科学論文など、主に編集作業を伴うコンテンツを指す。
> これに対して低品質言語データとは、ツイッター投稿などの、編集がおこなわれていないテキストを指す。
嫌儲と言うか5chはどちらかといえば低品質言語データのようだが、5chはまだ大雑把にジャンル分けされているから低品質の中でもまともなデータかもしれないな


0102 名無しさん 2023/07/24(月) 13:46:54.80 ID:pE0z4H5/0

進化は止まらないんだぁ~!!!
早くAI同士で学習しまくって新たなAI産ませろ


参照先 https://greta.5ch.net/test/read.cgi/poverty/1690151163/

Posted by oruka