国立情報学研究所がフルスクラッチで開発したAIモデルを公開…日本語性能でGPT-4oを上回るとのこと

1 : 2026/04/09(木) 23:57:40.20 ID:ClmRHfCm0

国立情報学研究所(NII)は4月3日、LLM「LLM-jp-4 8Bモデル」「LLM-jp-4 32B-A3Bモデル」をオープンソースライセンスで公開した。米OpenAIのオープンモデル「gpt-oss-20b」を上回る日本語性能をうたう。両モデルの学習に利用したデータセットも公開している。

LLM-jp-4 8Bは米Metaのオープンモデル「Llama 2」、LLM-jp-4 32B-A3Bは中国Alibabaのオープンモデル「Qwen3」のアーキテクチャを採用。事前学習にはWeb上の公開データや政府・国会の文書などで構成されるデータセットを利用し、フルスクラッチで開発した。約19.5兆トークンのうち約10.5兆トークンを事前学習に使用し、別途中間学習と追加学習も実施した。

日本語の処理性能を測るベンチマーク「日本語MT-Bench」では、gpt-oss-20bに加え、OpenAIのAIモデル「GPT-4o」や、AlibabaのAIモデル「Qwen3-8B」のスコアを上回ったという。英語の性能についても、これら海外企業のAIモデルと同等以上とアピールしている。

新たな「国産LLM」公開、国立情報学研究所 「gpt-oss-20b」超えの日本語性能うたう(ITmedia NEWS) - Yahoo!ニュース
国立情報学研究所(NII)は4月3日、LLM「LLM-jp-4 8Bモデル」「LLM-jp-4 32B-A3Bモデル」をオープンソースライセンスで公開した。米OpenAIのオープンモデル「gpt-
レス1番のリンク先のサムネイル画像
3 : 2026/04/09(木) 23:58:29.65 ID:ClmRHfCm0
うむ…
4 : 2026/04/09(木) 23:59:00.77 ID:on0Giqaz0
フルスクラッチとは
6 : 2026/04/09(木) 23:59:48.86 ID:1YftJ0+E0
>>4
全部社内でプログラミングしたってこと
25 : 2026/04/10(金) 00:12:02.85 ID:wiBbrVBb0
>>4
市販のプラモデルやフィギュアのキット、パーツを一切使わず、粘土やパテ、プラスチック板などの素材から、ゼロ(一から)で原型を自作する手法のこと
5 : 2026/04/09(木) 23:59:28.84 ID:SzQQNIv/0
今更GPT-4程度で自慢されてもな
7 : 2026/04/10(金) 00:01:00.33 ID:Pof675hn0
ゴミモデルやんGemini3proくらいないと相手してもらえないぞ
8 : 2026/04/10(金) 00:01:24.27 ID:uj/xC1PC0
openaiとかanthropicとかgoogleとかmetaとか
年間数兆円かけて開発してるわけで、この競争について行けるわけない
9 : 2026/04/10(金) 00:01:53.72 ID:BmOGvrgvr
オープンソースのLLMにちょこっと学習させてフルスクラッチで開発したは無理だろ
10 : 2026/04/10(金) 00:01:55.06 ID:k6/6EgQu0
プラバンとパテを使わないフルスクラッチなどありえない
11 : 2026/04/10(金) 00:01:55.52 ID:1c+fT+mk0
エ口動画作れたりモザイク破壊4K化とかできる?
12 : 2026/04/10(金) 00:02:07.66 ID:lFgyrlRS0
自己評価ではなァ!ほんまのほんまか?!(`・ω・´)
13 : 2026/04/10(金) 00:02:14.45 ID:66eCHZgZ0
2年遅れ
これからもっと遅れるんだろ
14 : 2026/04/10(金) 00:02:49.67 ID:sAcQ/oRg0
だから都合のいい指標で盛ってこれだから悲しいのに晒してやるな
15 : 2026/04/10(金) 00:03:11.15 ID:oj7+7pts0
ある程度はコモディティ化する分野だから、資金が無くても、追いつけはしなくても近づくことはできるかもね
16 : 2026/04/10(金) 00:03:29.70 ID:P0l+NGrm0
開発資金を宝くじのスクラッチのみで集金したって意味だろ
18 : 2026/04/10(金) 00:04:58.63 ID:e7schsCi0
GPT5.2超えないとダメだろ
19 : 2026/04/10(金) 00:06:16.61 ID:5iTdTPHr0
値上げされても困るし国産として育てていけ
20 : 2026/04/10(金) 00:07:57.09 ID:Vq+orPxg0
コードをフルスクラッチで書いたのではなく
(残念ながら日本にそんな能力はない)、
フルスクラッチ学習
21 : 2026/04/10(金) 00:08:06.81 ID:Jn1FAlAU0
嘘つきジャップを信用できるかよ
22 : 2026/04/10(金) 00:08:50.63 ID:uv/9JJd40
エッチなことに使えるかどうかが重要
23 : 2026/04/10(金) 00:09:09.72 ID:FaWkrf/50
つまりフルスクラッチではないよね
24 : 2026/04/10(金) 00:09:09.63 ID:H7LSt0UX0
数年遅れのままついていけば枯れた頃に実用レベルになれるだろ
26 : 2026/04/10(金) 00:12:22.87 ID:BmOGvrgvr
日本の理系って態度だけデカくて全然技術ないよね
27 : 2026/04/10(金) 00:12:30.37 ID:KMUPprHRH
32bで旧世代の8bを上回ったって?
28 : 2026/04/10(金) 00:12:32.33 ID:KsYJTzpW0
日本語用途ならええんやないの?
もうQWEN3.6だし、さっさと次を出して欲しい
30 : 2026/04/10(金) 00:13:35.20 ID:x6ZrkvuJ0
今のGPTのパラメータ数20Bどころじゃないだろ
4oに勝るわけがない
31 : 2026/04/10(金) 00:13:44.01 ID:N0YEq5Ix0
国産のAIって4oと比較したがるよね
いつのモデルだと思ってんだよ
34 : 2026/04/10(金) 00:15:01.61 ID:KvDcTgd50
>>31
4oなら最新のオープンソース使えば超えられるんでしょ😂
32 : 2026/04/10(金) 00:14:24.08 ID:Vrmazj9R0
周回遅れのジャップにしてはかなり頑張ってる方だしそう言ったるなよ
33 : 2026/04/10(金) 00:14:57.40 ID:WLKte8liH
おっっそ
ソフバンはQwen使っててAIバブル崩壊も近いのに無駄金出すなよ
別の研究と開発させろよ
35 : 2026/04/10(金) 00:15:15.78 ID:HwnS13+P0
エルエムアリーナに出てないよね?

コメント

タイトルとURLをコピーしました