国立情報学研究所がフルスクラッチで開発したAIモデルを公開…日本語性能でGPT-4oを上回るとのこと

1 : 2026/04/09(木) 23:57:40.20 ID:ClmRHfCm0

国立情報学研究所（NII）は4月3日、LLM「LLM-jp-4 8Bモデル」「LLM-jp-4 32B-A3Bモデル」をオープンソースライセンスで公開した。米OpenAIのオープンモデル「gpt-oss-20b」を上回る日本語性能をうたう。両モデルの学習に利用したデータセットも公開している。

LLM-jp-4 8Bは米Metaのオープンモデル「Llama 2」、LLM-jp-4 32B-A3Bは中国Alibabaのオープンモデル「Qwen3」のアーキテクチャを採用。事前学習にはWeb上の公開データや政府・国会の文書などで構成されるデータセットを利用し、フルスクラッチで開発した。約19.5兆トークンのうち約10.5兆トークンを事前学習に使用し、別途中間学習と追加学習も実施した。

日本語の処理性能を測るベンチマーク「日本語MT-Bench」では、gpt-oss-20bに加え、OpenAIのAIモデル「GPT-4o」や、AlibabaのAIモデル「Qwen3-8B」のスコアを上回ったという。英語の性能についても、これら海外企業のAIモデルと同等以上とアピールしている。

新たな「国産LLM」公開、国立情報学研究所　「gpt-oss-20b」超えの日本語性能うたう（ITmedia NEWS） - Yahoo!ニュース
国立情報学研究所（NII）は4月3日、LLM「LLM-jp-4 8Bモデル」「LLM-jp-4 32B-A3Bモデル」をオープンソースライセンスで公開した。米OpenAIのオープンモデル「gpt-
news.yahoo.co.jp

3 : 2026/04/09(木) 23:58:29.65 ID:ClmRHfCm0

うむ…

4 : 2026/04/09(木) 23:59:00.77 ID:on0Giqaz0

フルスクラッチとは

6 : 2026/04/09(木) 23:59:48.86 ID:1YftJ0+E0

>>4
全部社内でプログラミングしたってこと

25 : 2026/04/10(金) 00:12:02.85 ID:wiBbrVBb0

>>4
市販のプラモデルやフィギュアのキット、パーツを一切使わず、粘土やパテ、プラスチック板などの素材から、ゼロ（一から）で原型を自作する手法のこと

5 : 2026/04/09(木) 23:59:28.84 ID:SzQQNIv/0

今更GPT-4程度で自慢されてもな

7 : 2026/04/10(金) 00:01:00.33 ID:Pof675hn0

ゴミモデルやんGemini3proくらいないと相手してもらえないぞ

8 : 2026/04/10(金) 00:01:24.27 ID:uj/xC1PC0

openaiとかanthropicとかgoogleとかmetaとか
年間数兆円かけて開発してるわけで、この競争について行けるわけない

9 : 2026/04/10(金) 00:01:53.72 ID:BmOGvrgvr

オープンソースのLLMにちょこっと学習させてフルスクラッチで開発したは無理だろ

10 : 2026/04/10(金) 00:01:55.06 ID:k6/6EgQu0

プラバンとパテを使わないフルスクラッチなどありえない

11 : 2026/04/10(金) 00:01:55.52 ID:1c+fT+mk0

エ口動画作れたりモザイク破壊4K化とかできる？

12 : 2026/04/10(金) 00:02:07.66 ID:lFgyrlRS0

自己評価ではなァ！ほんまのほんまか？！(`･ω･´)

13 : 2026/04/10(金) 00:02:14.45 ID:66eCHZgZ0

２年遅れ
これからもっと遅れるんだろ

14 : 2026/04/10(金) 00:02:49.67 ID:sAcQ/oRg0

だから都合のいい指標で盛ってこれだから悲しいのに晒してやるな

15 : 2026/04/10(金) 00:03:11.15 ID:oj7+7pts0

ある程度はコモディティ化する分野だから、資金が無くても、追いつけはしなくても近づくことはできるかもね

16 : 2026/04/10(金) 00:03:29.70 ID:P0l+NGrm0

開発資金を宝くじのスクラッチのみで集金したって意味だろ

18 : 2026/04/10(金) 00:04:58.63 ID:e7schsCi0

GPT5.2超えないとダメだろ

19 : 2026/04/10(金) 00:06:16.61 ID:5iTdTPHr0

値上げされても困るし国産として育てていけ

20 : 2026/04/10(金) 00:07:57.09 ID:Vq+orPxg0

コードをフルスクラッチで書いたのではなく
(残念ながら日本にそんな能力はない)、
フルスクラッチ学習

21 : 2026/04/10(金) 00:08:06.81 ID:Jn1FAlAU0

嘘つきジャップを信用できるかよ

22 : 2026/04/10(金) 00:08:50.63 ID:uv/9JJd40

エッチなことに使えるかどうかが重要

23 : 2026/04/10(金) 00:09:09.72 ID:FaWkrf/50

つまりフルスクラッチではないよね

24 : 2026/04/10(金) 00:09:09.63 ID:H7LSt0UX0

数年遅れのままついていけば枯れた頃に実用レベルになれるだろ

26 : 2026/04/10(金) 00:12:22.87 ID:BmOGvrgvr

日本の理系って態度だけデカくて全然技術ないよね

27 : 2026/04/10(金) 00:12:30.37 ID:KMUPprHRH

32bで旧世代の8bを上回ったって？

28 : 2026/04/10(金) 00:12:32.33 ID:KsYJTzpW0

日本語用途ならええんやないの？
もうQWEN3.6だし、さっさと次を出して欲しい

30 : 2026/04/10(金) 00:13:35.20 ID:x6ZrkvuJ0

今のGPTのパラメータ数20Bどころじゃないだろ
4oに勝るわけがない

31 : 2026/04/10(金) 00:13:44.01 ID:N0YEq5Ix0

国産のAIって4oと比較したがるよね
いつのモデルだと思ってんだよ

34 : 2026/04/10(金) 00:15:01.61 ID:KvDcTgd50

>>31
4oなら最新のオープンソース使えば超えられるんでしょ😂

32 : 2026/04/10(金) 00:14:24.08 ID:Vrmazj9R0

周回遅れのジャップにしてはかなり頑張ってる方だしそう言ったるなよ

33 : 2026/04/10(金) 00:14:57.40 ID:WLKte8liH

おっっそ
ソフバンはQwen使っててAIバブル崩壊も近いのに無駄金出すなよ
別の研究と開発させろよ

35 : 2026/04/10(金) 00:15:15.78 ID:HwnS13+P0

エルエムアリーナに出てないよね？