【AI】GPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは? |
my_site | feed.lliy.biz |
【AI】GPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは? |
常識的に考えた |
GPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは? |
ITã¢ã³ãã |
【AI】AppleのAI研究者らが「今のAI言語モデルは算数の文章題への推論能力が小学生未満」と研究結果を発表 |
常識的に考えた |
今のAI言語モデルは「算数の文章題」への推論能力が小学生未満… 研究結果を発表 |
ç¡æ-ï¼ch(5ch)ã¾ã¨ãã¢ã³ããéå ± |
今のAI言語モデルは「算数の文章題」への推論能力が小学生未満… 研究結果を発表 |
知りタイムズ |
【AI】AppleのAI研究者らが「今のAI言語モデルは算数の文章題への推論能力が小学生未満」と研究結果を発表 |
ジオろぐ |
AppleのAI研究者らが「今のAI言語モデルは算数の文章題への推論能力が小学生未満」と研究結果を発表 |
æ ¼éæã¢ã³ãã |
AppleのAI研究者らが「今のAI言語モデルは算数の文章題への推論能力が小学生未満」と研究結果を発表 |
ITã¢ã³ãã |
Googleが大規模言語モデル「Gemma 2」のコンパクトバージョン「Gemma 2 2B」の日本語版をリリース |
ITã¢ã³ãã |
富士通、大規模言語モデル「Takane」提供開始 「世界一の日本語性能を持つ」とうたう |
ITã¢ã³ãã |
富士通、大規模言語モデル「Takane」提供開始 「世界一の日本語性能を持つ」とうたう |
PCパーツまとめ |
OpenAIのGPTシリーズ・MetaのLlama・BigScienceのBLOOMのような新しくて大きなバージョンの大規模言語モデルを使ったAIは無知を認めるよりも間違った答えを与える傾向が強い |
ITã¢ã³ãã |
Metaの大規模言語モデル「Llama 3.1」をファインチューニングしたAIモデル「Hermes 3」がリリースされる |
ITã¢ã³ãã |
数学を解ける言語モデル「Qwen2-Math」が登場、GPT-4o超えの数学性能 |
ITã¢ã³ãã |
【生成AI・大規模言語モデルとは 人材獲得・開発競争は?】日本経済における新たなトレンド「デジタル小作人」の登場とは? |
ãã¥ã¼ã¹ã¹ãã©ã¤ã«ã¼9 |
【AI】OpenAIの次世代大規模言語モデル「GPT-5」が2024年夏に公開されるとの報道 [すらいむ★] PINKちゃんねる【まとめ】 |
ðããã»ãð |
OpenAIが新たな最上位言語モデル「GPT-4o」を発表 |
芸能早わかり速報 |
「富岳」スーパーコンピュータが開発した日本語能力に優れた大規模言語モデル「Fugaku-LLM」が公開される |
ãã¤ãªã¼è¸ã¹ãç¹å ± |
ロボットのトレーニングを大規模言語モデルで加速する技術「DrEureka」をNVIDIAなどの研究チームが開発 |
æ ¼éæã¢ã³ãã |
ロボットのトレーニングを大規模言語モデルで加速する技術「DrEureka」をNVIDIAなどの研究チームが開発 |
ITã¢ã³ãã |
大規模言語モデルを使って組織内の全データを検索する時にはどのような前処理を行うと効率的なのか? |
æ ¼éæã¢ã³ãã |
大規模言語モデルを使って組織内の全データを検索する時にはどのような前処理を行うと効率的なのか? |
ITã¢ã³ãã |
LLM「Phi-3」スマホのローカルでも動く言語モデル公開!ガチ勢が動作確認した「gist」Colabに公開!量子化されたPhi3をノートパソコンで動かす動画あり |
ゲットレンドちゃんねる |
LLM「Phi-3」スマホのローカルでも動く言語モデル公開!ガチ勢が動作確認した「gist」Colabに公開!量子化されたPhi3をノートパソコンで動かす動画あり |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
【AI】陰謀論者 vs. 生成AI──大規模言語モデルは陰謀論を説得できるか? 米MITなどが2000人以上で検証 |
ジオろぐ |
LLM「Phi-3」スマホで動かせる言語モデル「技術レポート」発表!phi-3-miniは4bit量子化でメモリ使用量「約1.8GB」デモ映像公開!動画あり |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
【AI】OpenAIの次世代大規模言語モデル「GPT-5」が2024年夏に公開されるとの報道 |
常識的に考えた |
大規模言語モデルの計算能力を桁違いに増強するカスタマイズハードウェアを作るスタートアップ「MatX」 |
ITã¢ã³ãã |
【大学】東大松尾研、大規模言語モデルの研究者&開発エンジニアを募集 「LLM研究をさらに加速させる」 [すらいむ★] |
ちゃーもるまとめ |
Llama 2などの大規模言語モデルをローカルで動かせるライブラリ「Ollama」がAMD製グラボに対応 |
ITã¢ã³ãã |
【朗報】イーロン「これが真のOpenAIだ」大規模言語モデル「Grok」をオープンソース化!3140億パラメータの最大級モデルが世に放たれる |
åªã®ã¤ãã |
イーロン「これが真のOpenAIだ」大規模言語モデル「Grok」をオープンソース化!3140億パラメータの最大級モデルが世に放たれる |
プロトタイプ5ちゃんねる |
大規模言語モデルを用いて3Dコンテンツの手続き型モデリングを実現するフレームワーク「3D-GPT」が登場 |
ITã¢ã³ãã |
「見ず知らずの他人がChatGPTに搭載されている大規模言語モデルから自分のメールアドレスを入手していた」という報告 |
ITã¢ã³ãã |
無料で商用利用可能な大規模言語モデル「Mixtral 8x7B」が登場、低い推論コストでGPT-3.5と同等以上の性能を発揮可能 |
ITã¢ã³ãã |
GPU非搭載ノートPCでもコマンド不要で各種言語モデルの性能を試せる実行環境「LM Studio」レビュー |
ITã¢ã³ãã |
ChatGPTを超えるという大規模言語モデル「OpenChat」をローカルで動作させて実力を確かめてみた |
ITã¢ã³ãã |
大規模言語モデル(LLM)をLoRAで強化する際に役立つ情報を研究者が公開 |
ITã¢ã³ãã |
大規模言語モデルが「幻覚」を引き起こすリスクを客観的に検証できるオープンソースの評価モデルをVectaraがリリース |
æ ¼éæã¢ã³ãã |
大規模言語モデルが「幻覚」を引き起こすリスクを客観的に検証できるオープンソースの評価モデルをVectaraがリリース |
ITã¢ã³ãã |
国産LLM「calm2-7b-chat」超長文の日本語に対応!ウマ娘で有名なサイバーエージェントが開発した大規模言語モデルを使ってみた動画あり |
ゲットレンドちゃんねる |
LLM「Japanese Stable LM Beta」StabilityAI Japanが日本語特化の大規模言語モデル「JSLM Beta」7Bと70Bの2種類公開! |
ゲットレンドちゃんねる |
国産LLM「calm2-7b-chat」超長文の日本語に対応!ウマ娘で有名なサイバーエージェントが開発した大規模言語モデルを使ってみた動画あり |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
LLM「Japanese Stable LM Beta」StabilityAI Japanが日本語特化の大規模言語モデル「JSLM Beta」7Bと70Bの2種類公開! |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
Stability AI「Japanese Stable LM 」3B-4E1TとGamma 7B「日本語特化の大規模言語モデル」LLMを商用利用可能で公開! |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
国立情報学研究所「LLM-jp-13B」NIIが開発したLLM!130億パラメータの大規模言語モデル「商用利用可能」リーダーボード公開! |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
Baiduが大規模言語モデル「Ernie 4.0」を発表、全ての点でGPT-4に匹敵する実力を持つ |
ITã¢ã³ãã |
私はChatGPTと呼ばれるAIです。OpenAIが開発した大規模な言語モデルです。 |
おいでよ!ガジェットの森 |
本当にオープンソースのライセンスで利用&検証できる大規模言語モデル「Mistral 7B」が登場、「Llama 2 13B」や「Llama 1 34B」を上回る性能のAI開発が可能 |
ITã¢ã³ãã |
Googleが「大規模言語モデルに視覚を与える仕組み」について解説、メルカリと協力して作成したデモも公開 |
ITã¢ã³ãã |
LLM「Weblab-10B」日本語言語モデルで最高水準!東京大学「松尾研究所」商用利用できない無料で使えるオープンソースモデル公開! |
ゲットレンドちゃんねる |
LLM「Weblab-10B」日本語言語モデルで最高水準!東京大学「松尾研究所」商用利用できない無料で使えるオープンソースモデル公開! |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
AI画像「JapaneseInstructBLIP」Alpha公開!遂に「日本語向け画像言語モデル」入力画像の文字説明を生成できる神機能実装! |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
LLM「通義千問」中国製AI!ババクラウドが大規模言語モデル公開「Qwen-7B」「Qwen-7B-Chat」テンセント「YuewenMiaoBi」創作支援ツール発表 |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
LLM「Japanese StableLM Base Alpha 7B」日本語言語モデル公開!日本語LLMをStabilityAIが開発!Emad氏も日本語で「おつかれさまでした」 |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
1万種類を超える大規模言語モデル(LLM)をまとめてダウンロード数や類似性などを分かりやすく視覚化したデータライブラリが公開される |
ITã¢ã³ãã |
アップル「AppleGPT」という大規模言語モデルのテストを開始 |
ITã»AIæ
å ±ã¾ã¨ãã¡ãããã |
Appleが独自の大規模言語モデルとチャットボットAI「Apple GPT」を開発中か |
ITã¢ã³ãã |
LLM「Llama2」chatGPTレベルの大規模言語モデル登場「ggml変換ニキ」たった一晩でLlma2の配布作業を完了するhuggingfaceで無料公開中! |
ゲットレンドちゃんねる |
メタ、AI言語モデル「ラマ2」無料公開 資金少ない企業の活用促す |
魔法熟女/美魔女ッ娘メグみみちゃんのニートッフルステーションMAX! ニート仙人の映画三昧老後生活!(無職孤独居老人的まとめ速報Z)] |
LLM「Llama2」chatGPTレベルの大規模言語モデル登場「ggml変換ニキ」たった一晩でLlma2の配布作業を完了するhuggingfaceで無料公開中! |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
LLM「Llama2」最新大規模言語モデル!対話特化型「Llama2-Chat」ChatGPT3.5turboと同性能!オープンソースではなく競合モデルの学習利用は禁止 |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
Metaが商用可能な大規模言語モデル「Llama 2」を無料公開、MicrosoftやQualcommと強力してスマホやPCへの最適化も |
ITã¢ã³ãã |
私はChatGPTと呼ばれるAIです。OpenAIが開発した大規模な言語モデルです。 |
プロトタイプ5ちゃんねる |
従来の大規模言語モデルの制約だった「入力量の限界」を取り払った「RWKV」は一体どんな言語モデルなのか? |
ITã¢ã³ãã |
国産LLM「NICT生成AI試作」情報通信研究機構が日本語特化の大規模言語モデル開発!LLMで日本最大級「1790億パラメータ」新モデルも学習中! |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
Metaがオープンソースで公開した言語モデルで少女とセックスできるAIを作った不届き者が現る |
ãã絵師 / 5chã¾ã¨ã |
Metaがオープンソースで公開した言語モデルで少女とセックスできるAIを作った不届き者が現る |
ããã¾ãã§ã |
Metaがオープンソースで公開した言語モデルで少女とセックスできるAIを作った不届き者が現る (感想まとめ) |
ãã§ã¿ã· |
Metaがオープンソースで公開した言語モデルで少女とセックスできるAIを作った不届き者が現る |
ããããã·ã¹ãã |
Metaがオープンソースで公開した言語モデルで少女とセックスできるAIを作った不届き者が現る [794431297] 『感想』 |
ããã© ï½ 5chã¾ã¨ãã»2chã¾ã¨ã |
【WBS未公開】AIで車を制御!LLM:大規模言語モデルの実力(2023年6月23日) |
ç¥æµè¢ wiki ã¾ã¨ã |
ChatGPTのような高性能言語モデルを生み出した技術はどんな仕組みなのか?をAI企業のエンジニアが多数の図解でゼロから解説 |
ITã¢ã³ãã |
大規模言語モデルの出力スピードを最大24倍に高めるライブラリ「vLLM」が登場、メモリ効率を高める新たな仕組み「PagedAttention」とは? |
ITã¢ã³ãã |
APIを呼び出すコードの生成に特化した大規模言語モデル「Gorilla」、APIの更新にリアルタイムで追従可能&オープンソースでモデル・トレーニングデータが公開済み |
ITã¢ã³ãã |
Metaの大規模言語モデル「LLaMa」に入力した文章がどのようなトークンとして認識しているかを確認できる「LLaMA-Tokenizer」 |
ITã¢ã³ãã |
AIチャット「Perplexity」自分用に回答最適化できる神ツール!LLM「FinGPT」金融特化型の大規模言語モデル公開!解説あり |
ゲットレンドちゃんねる |
AIチャット「Perplexity」自分用に回答最適化できる神ツール!LLM「FinGPT」金融特化型の大規模言語モデル公開!解説あり |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
AIチャット「rinna/japanese-gpt-neox-3.6b」最も優れた日本語言語モデル!「StabilityAI Japan」公認の全評価項目で1位の最強モデル |
ゲットレンドちゃんねる |
AIチャット「rinna/japanese-gpt-neox-3.6b」最も優れた日本語言語モデル!「StabilityAI Japan」公認の全評価項目で1位の最強モデル |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
大規模言語モデル「LLaMA-AdapterMultimodal」LLaMAマルチモーダル版「画像動画など入力対応」ゼルダの画像認識して説明表示!画像あり |
ゲットレンドちゃんねる |
オープンソースで商用利用可能な大規模言語モデル「Falcon」が登場、オープンソースモデルの中では最高の性能に |
ITã¢ã³ãã |
大規模言語モデル「LLaMA-AdapterMultimodal」LLaMAマルチモーダル版「画像動画など入力対応」ゼルダの画像認識して説明表示!画像あり |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
大規模言語モデル「RLHF」LLMをファインチューニングする方法「社会人向けデータサイエンス入門」無料で見れる資料まとめ |
ゲットレンドちゃんねる |
【機械学習】GPUメモリが小さくてもパラメーター数が大きい言語モデルをトレーニング可能になる手法が登場、一体どんな手法なのか? |
ãããã¾ã¨ãã |
大規模言語モデル「RLHF」LLMをファインチューニングする方法「社会人向けデータサイエンス入門」無料で見れる資料まとめ |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
GPUメモリが小さくてもパラメーター数が大きい言語モデルをトレーニング可能になる手法「QLoRA」が登場、一体どんな手法なのか? |
ITã¢ã³ãã |
OpenAI「PRM」大規模言語モデルの数学能力を向上させる新フレームワーク「グロッキング」生成AIの性能引き出す新技術!解説あり |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
「人間の子供が聞く量の単語」のみで大規模言語モデルを新たにトレーニングするチャレンジ「BabyLM Challenge」が開催中、誰でも挑戦可能 |
ITã¢ã³ãã |
Metaの大規模言語モデル「LLaMA」がChatGPTを再現できる可能性があるとさまざまなチャットAI用言語モデルのベンチマーク測定で判明 |
æ ¼éæã¢ã³ãã |
Metaの大規模言語モデル「LLaMA」がChatGPTを再現できる可能性があるとさまざまなチャットAI用言語モデルのベンチマーク測定で判明 |
ITã¢ã³ãã |
スーパーコンピュータ「富岳」で大規模言語モデル作成へ |
ロジカル速報 |
国産LLM「和製生成AI」スパコン富岳使用して大規模言語モデル開発「日本語のAI学習はウィキペディア予定」サイバーエージェントも連携検討 |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
Googleが大規模言語モデル「PaLM 2」のテクニカルレポートを公開するも肝心な部分の情報は記載されず |
ITã¢ã³ãã |
大規模言語モデルの開発者が知っておくと役立つさまざまな数字 |
ITã¢ã³ãã |
大規模言語モデル「rinna/japanese-gpt-neox-3.6b」rinna製の日本語LLM公開!対話用モデル「GPT型チャットAI」rinna-3.6bも同時公開! |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
大規模言語モデル「open-calm」サイバーエージェントが日本語LLMを公開!paperspaceで動かす方法とLoRA学習できるか試してみた画像あり |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |
【AI速報】5chとニュースサイトを学習素材にした大規模言語モデルが公開され話題に |
ロジカル速報 |
AIチャット「Stabolity AI Japan」日本語モデル初期バージョン公開「StableDiffusion」運営会社のオープンソース言語モデル!画像あり |
ã¡ã¿ãã¼ã¹éå ±ãã¡ã¿ãã¼ã¹ã¾ã¨ã |