言語モデル - 【衝撃】2.8兆パラのムーンショットAI「キミK3」発表！米中激変の真実と大規模言語モデルの勝者とは [SnapMato.Me]

【衝撃】2.8兆パラのムーンショットAI「キミK3」発表！米中激変の真実と大規模言語モデルの勝者とは	テクノロジーまとめ
【朗報】AIが自己改善！言語モデルを自律最適化し業務効率を10倍にする裏技	テクノロジーまとめ
【衝撃】NVIDIA一強終了か？AI大規模言語モデルの推論を劇的に安くする革新技術が登場	テクノロジーまとめ
【衝撃】大規模言語モデルの再学習が不要に？因果推論で学習データの最適化を変える新手法が登場	テクノロジーまとめ
llama.cppがAI言語モデルに使用するファイル形式「GGUF」にはウェイト以外に何が含まれているのか？	ITã¢ã³ãã
【速報】アンドレイ・カーパシーがアンスロピックへ！大規模言語モデル開発の歴史が変わる天才の決断	テクノロジーまとめ
AMD製AIチップで開発された拡散言語モデル「ZAYA1-8B-Diffusion-Preview」が登場、自己回帰モデルを拡散モデルに変換	æ ¼éæã¢ã³ãã
AMD製AIチップで開発された拡散言語モデル「ZAYA1-8B-Diffusion-Preview」が登場、自己回帰モデルを拡散モデルに変換	ITã¢ã³ãã
【速報】AI多言語モデルがオフラインで70言語対応！インド発、驚異の進化！	テクノロジーまとめ
1800～1875年のデータのみでトレーニングされた大規模言語モデル「TimeCapsule LLM」 – GIGAZINE	Plenty Of Quality
大規模言語モデルへの攻撃において「詩」が有効であるとの研究結果	ITã¢ã³ãã
EU公式24言語と日本語を含むその他11言語に対応したヨーロッパ製の大規模言語モデル「EuroLLM」がオープンソースで公開中なので実際に使ってみたレビュー	ITã¢ã³ãã
読者投稿：言語モデルを比較するのにオススメなサイト	やる夫達のいる日常
韓国企業が独自の大型言語モデルを開発し、グローバル競争に挑む新たな動き	テクノロジーまとめ
Alibabaがリアルタイムで音声会話できるAIモデル「Qwen3-Omni」やGPT-5と同等性能の画像認識AIモデル「Qwen3-VL」を公開、他にも言語モデルや画像編集モデルを一挙大量公開	ITã¢ã³ãã
国際的な小咄読者投稿言語モデルを比較するのにオススメなサイト	暇な時にやる夫まとめ
ChatGPTなどの言語モデルに仕事を奪われる危険性がある職業ベスト20	ãã¾ã¨ã
Microsoft、「Phi-4-mini-flash-reasoning」を発表～スループットは10倍、レイテンシは2～3倍削減／非力なデバイスでも動作する小規模言語モデル	ç¡æ-ï¼ch(5ch)ã¾ã¨ãã¢ã³ããéå ±
多言語・長文コンテキスト推論AI「SmolLM3」をHugging Faceがリリース、パラメータの少ない小規模言語モデルでありながらより大規模な言語モデルの性能に匹敵	ITã¢ã³ãã
三菱電機、製造業向けエッジデバイスの新言語モデルとは？	ãã¥ã¼ã¹ãã£ã³ãã«
最先端の大規模言語モデル(LLM)が難解なコーディング問題を1発で正解する確率はゼロ％、競技プログラマーなどの熟練スキルを持つ人間には依然として歯が立たないことが明らかに	ITã¢ã³ãã
Googleの拡散型言語モデル「Gemini Diffusion」はどれくらい爆速なのか？	æ ¼éæã¢ã³ãã
Googleの拡散型言語モデル「Gemini Diffusion」はどれくらい爆速なのか？	ITã¢ã³ãã
IBMが大規模言語モデルの「Bamba」をオープンソースで公開	ITã¢ã³ãã
大規模視覚言語モデルは人間のように「地図を読み取って最適なルートを見つける」ことができるのか？	my_site \| feed.lliy.biz
大規模視覚言語モデルは人間のように「地図を読み取って最適なルートを見つける」ことができるのか？	常識的に考えた
大規模言語モデルの処理順序が人間の脳の神経活動と類似しているとGoogleの研究者が主張	常識的に考えた
Googleが単一のGPUで実行できる中では過去最高の大規模言語モデル「Gemma 3」を発表	ITã¢ã³ãã
AMDがAMD製GPUでトレーニングしたオープンソースの言語モデル「Instella」をリリース、同等モデルより高性能	ITã¢ã³ãã
人型ロボットを家庭で動かすのに特化したAI言語モデル「Helix」をFigureが発表	æ ¼éæã¢ã³ãã
人型ロボットを家庭で動かすのに特化したAI言語モデル「Helix」をFigureが発表	ITã¢ã³ãã
楽天、AIモデル「Rakuten AI 2.0」シリーズを無料公開、大規模言語モデル＆小規模言語モデルの2形態で	やきうJ
中国父さん、性能deepseek以上の画期的なAI言語モデル「Qwen2.5-Plus」を無料で公開してしまうwww	プロトタイプ5ちゃんねる
PCやスマートフォンのUIを認識して自動操作できる視覚言語モデル「Qwen2.5 VL」をAlibabaのAI研究チームがリリース、GPT-4o超えの性能で航空券の予約などを自動で実行可能	ITã¢ã³ãã
メモリ1GB未満のノートPCでも動くビジュアル言語モデル「Smolvlm-256m」「Smolvlm-500m」をHugging Faceがリリース	ITã¢ã³ãã
【AI】理科大が大規模視覚-言語モデルから任意の知識を“忘却”させる技術を開発	my_site \| feed.lliy.biz
【AI】理科大が大規模視覚-言語モデルから任意の知識を“忘却”させる技術を開発	常識的に考えた
【AI】GPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは？	my_site \| feed.lliy.biz
【AI】GPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは？	常識的に考えた
GPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは？	ITã¢ã³ãã
【AI】AppleのAI研究者らが「今のAI言語モデルは算数の文章題への推論能力が小学生未満」と研究結果を発表	常識的に考えた
今のAI言語モデルは「算数の文章題」への推論能力が小学生未満… 研究結果を発表	ç¡æ-ï¼ch(5ch)ã¾ã¨ãã¢ã³ããéå ±
今のAI言語モデルは「算数の文章題」への推論能力が小学生未満… 研究結果を発表	知りタイムズ
【AI】AppleのAI研究者らが「今のAI言語モデルは算数の文章題への推論能力が小学生未満」と研究結果を発表	ジオろぐ
AppleのAI研究者らが「今のAI言語モデルは算数の文章題への推論能力が小学生未満」と研究結果を発表	æ ¼éæã¢ã³ãã
AppleのAI研究者らが「今のAI言語モデルは算数の文章題への推論能力が小学生未満」と研究結果を発表	ITã¢ã³ãã
Googleが大規模言語モデル「Gemma 2」のコンパクトバージョン「Gemma 2 2B」の日本語版をリリース	ITã¢ã³ãã
富士通、大規模言語モデル「Takane」提供開始　「世界一の日本語性能を持つ」とうたう	ITã¢ã³ãã
富士通、大規模言語モデル「Takane」提供開始　「世界一の日本語性能を持つ」とうたう	PCパーツまとめ
OpenAIのGPTシリーズ・MetaのLlama・BigScienceのBLOOMのような新しくて大きなバージョンの大規模言語モデルを使ったAIは無知を認めるよりも間違った答えを与える傾向が強い	ITã¢ã³ãã
Metaの大規模言語モデル「Llama 3.1」をファインチューニングしたAIモデル「Hermes 3」がリリースされる	ITã¢ã³ãã
数学を解ける言語モデル「Qwen2-Math」が登場、GPT-4o超えの数学性能	ITã¢ã³ãã
【生成AI・大規模言語モデルとは　人材獲得・開発競争は？】日本経済における新たなトレンド「デジタル小作人」の登場とは？	ãã¥ã¼ã¹ã¹ãã©ã¤ã«ã¼9
【AI】OpenAIの次世代大規模言語モデル「GPT-5」が2024年夏に公開されるとの報道 [すらいむ★] PINKちゃんねる【まとめ】	ðããã»ãð
OpenAIが新たな最上位言語モデル「GPT-4o」を発表	芸能早わかり速報
「富岳」スーパーコンピュータが開発した日本語能力に優れた大規模言語モデル「Fugaku-LLM」が公開される	ãã¤ãªã¼è¸ã¹ãç¹å ±
ロボットのトレーニングを大規模言語モデルで加速する技術「DrEureka」をNVIDIAなどの研究チームが開発	æ ¼éæã¢ã³ãã
ロボットのトレーニングを大規模言語モデルで加速する技術「DrEureka」をNVIDIAなどの研究チームが開発	ITã¢ã³ãã
大規模言語モデルを使って組織内の全データを検索する時にはどのような前処理を行うと効率的なのか？	æ ¼éæã¢ã³ãã
大規模言語モデルを使って組織内の全データを検索する時にはどのような前処理を行うと効率的なのか？	ITã¢ã³ãã
LLM「Phi-3」スマホのローカルでも動く言語モデル公開！ガチ勢が動作確認した「gist」Colabに公開！量子化されたPhi3をノートパソコンで動かす動画あり	ゲットレンドちゃんねる
LLM「Phi-3」スマホのローカルでも動く言語モデル公開！ガチ勢が動作確認した「gist」Colabに公開！量子化されたPhi3をノートパソコンで動かす動画あり	ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã
【AI】陰謀論者 vs. 生成AI──大規模言語モデルは陰謀論を説得できるか？　米MITなどが2000人以上で検証	ジオろぐ
LLM「Phi-3」スマホで動かせる言語モデル「技術レポート」発表！phi-3-miniは4bit量子化でメモリ使用量「約1.8GB」デモ映像公開！動画あり	ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã
【AI】OpenAIの次世代大規模言語モデル「GPT-5」が2024年夏に公開されるとの報道	常識的に考えた
大規模言語モデルの計算能力を桁違いに増強するカスタマイズハードウェアを作るスタートアップ「MatX」	ITã¢ã³ãã
【大学】東大松尾研、大規模言語モデルの研究者＆開発エンジニアを募集　「LLM研究をさらに加速させる」 [すらいむ★]	ちゃーもるまとめ
Llama 2などの大規模言語モデルをローカルで動かせるライブラリ「Ollama」がAMD製グラボに対応	ITã¢ã³ãã
【朗報】イーロン「これが真のOpenAIだ」大規模言語モデル「Grok」をオープンソース化！3140億パラメータの最大級モデルが世に放たれる	åªã®ã¤ãã
イーロン「これが真のOpenAIだ」大規模言語モデル「Grok」をオープンソース化！3140億パラメータの最大級モデルが世に放たれる	プロトタイプ5ちゃんねる
大規模言語モデルを用いて3Dコンテンツの手続き型モデリングを実現するフレームワーク「3D-GPT」が登場	ITã¢ã³ãã
「見ず知らずの他人がChatGPTに搭載されている大規模言語モデルから自分のメールアドレスを入手していた」という報告	ITã¢ã³ãã
無料で商用利用可能な大規模言語モデル「Mixtral 8x7B」が登場、低い推論コストでGPT-3.5と同等以上の性能を発揮可能	ITã¢ã³ãã
GPU非搭載ノートPCでもコマンド不要で各種言語モデルの性能を試せる実行環境「LM Studio」レビュー	ITã¢ã³ãã
ChatGPTを超えるという大規模言語モデル「OpenChat」をローカルで動作させて実力を確かめてみた	ITã¢ã³ãã
大規模言語モデル(LLM)をLoRAで強化する際に役立つ情報を研究者が公開	ITã¢ã³ãã
大規模言語モデルが「幻覚」を引き起こすリスクを客観的に検証できるオープンソースの評価モデルをVectaraがリリース	æ ¼éæã¢ã³ãã
大規模言語モデルが「幻覚」を引き起こすリスクを客観的に検証できるオープンソースの評価モデルをVectaraがリリース	ITã¢ã³ãã
国産LLM「calm2-7b-chat」超長文の日本語に対応！ウマ娘で有名なサイバーエージェントが開発した大規模言語モデルを使ってみた動画あり	ゲットレンドちゃんねる
LLM「Japanese Stable LM Beta」StabilityAI Japanが日本語特化の大規模言語モデル「JSLM Beta」7Bと70Bの2種類公開！	ゲットレンドちゃんねる
国産LLM「calm2-7b-chat」超長文の日本語に対応！ウマ娘で有名なサイバーエージェントが開発した大規模言語モデルを使ってみた動画あり	ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã
LLM「Japanese Stable LM Beta」StabilityAI Japanが日本語特化の大規模言語モデル「JSLM Beta」7Bと70Bの2種類公開！	ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã
Stability AI「Japanese Stable LM 」3B-4E1TとGamma 7B「日本語特化の大規模言語モデル」LLMを商用利用可能で公開！	ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã
国立情報学研究所「LLM-jp-13B」NIIが開発したLLM！130億パラメータの大規模言語モデル「商用利用可能」リーダーボード公開！	ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã
Baiduが大規模言語モデル「Ernie 4.0」を発表、全ての点でGPT-4に匹敵する実力を持つ	ITã¢ã³ãã
私はChatGPTと呼ばれるAIです。OpenAIが開発した大規模な言語モデルです。	おいでよ！ガジェットの森
本当にオープンソースのライセンスで利用＆検証できる大規模言語モデル「Mistral 7B」が登場、「Llama 2 13B」や「Llama 1 34B」を上回る性能のAI開発が可能	ITã¢ã³ãã
Googleが「大規模言語モデルに視覚を与える仕組み」について解説、メルカリと協力して作成したデモも公開	ITã¢ã³ãã
LLM「Weblab-10B」日本語言語モデルで最高水準！東京大学「松尾研究所」商用利用できない無料で使えるオープンソースモデル公開！	ゲットレンドちゃんねる
LLM「Weblab-10B」日本語言語モデルで最高水準！東京大学「松尾研究所」商用利用できない無料で使えるオープンソースモデル公開！	ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã
AI画像「JapaneseInstructBLIP」Alpha公開！遂に「日本語向け画像言語モデル」入力画像の文字説明を生成できる神機能実装！	ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã
LLM「通義千問」中国製AI！ババクラウドが大規模言語モデル公開「Qwen-7B」「Qwen-7B-Chat」テンセント「YuewenMiaoBi」創作支援ツール発表	ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã
LLM「Japanese StableLM Base Alpha 7B」日本語言語モデル公開！日本語LLMをStabilityAIが開発！Emad氏も日本語で「おつかれさまでした」	ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã
1万種類を超える大規模言語モデル(LLM)をまとめてダウンロード数や類似性などを分かりやすく視覚化したデータライブラリが公開される	ITã¢ã³ãã
アップル「AppleGPT」という大規模言語モデルのテストを開始	ITã»AIæå ±ã¾ã¨ãã¡ãããã
Appleが独自の大規模言語モデルとチャットボットAI「Apple GPT」を開発中か	ITã¢ã³ãã
LLM「Llama2」chatGPTレベルの大規模言語モデル登場「ggml変換ニキ」たった一晩でLlma2の配布作業を完了するhuggingfaceで無料公開中！	ゲットレンドちゃんねる
メタ、AI言語モデル「ラマ2」無料公開　資金少ない企業の活用促す	魔法熟女/美魔女ッ娘メグみみちゃんのニートッフルステーションMAX！ニート仙人の映画三昧老後生活！（無職孤独居老人的まとめ速報Z)]
LLM「Llama2」chatGPTレベルの大規模言語モデル登場「ggml変換ニキ」たった一晩でLlma2の配布作業を完了するhuggingfaceで無料公開中！	ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã
LLM「Llama2」最新大規模言語モデル！対話特化型「Llama2-Chat」ChatGPT3.5turboと同性能！オープンソースではなく競合モデルの学習利用は禁止	ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã

#言語モデル	255
#大規模	153
#公開	58
#日本語	41
#LLM	40
#オープンソース	39
#モデル	36
#開発	35
#チャット	35
#発表	32
#登場	29
#GPT	28
#性能	23
#可能	23
#ChatGPT	23
#対応	21
#Meta	20
#能力	18
#利用	17
#無料	17
#リリース	17
#LLaMA	16
#商用	16
#推論	15
#研究	14
#OpenAI	14

#言語モデル