Google「OpenAI?強いよね。隙がないと思うよ。だけど俺は」150万トークン対応の次世代AIモデル「Gemini 1.5」を発表! [163661708]
■ このスレッドは過去ログ倉庫に格納されています
Google、次世代AIモデル「Gemini 1.5」発表。最大100万トークン対応、複数モダリティの理解向上など
Googleは2月16日、同社のAIモデルの新バージョン「Gemini 1.5」を発表した。
同社は、2023年12月に新しいAIモデル「Gemini」を発表し、AIチャットサービス「Bard」の名称も「Gemini」に改称。同社製のAIモデルおよびサービスの名称を「Gemini」に統一していた。
Geminiは、安全性を重視しながら急速な機能改善が進められているという。GeminiにはUltra/Pro/Nanoの3段階のモデルがあるが、初期テスト用として公開されるGemini 1.5 Pro(中位モデル)は、従来のGemini 1.0 Ultra(上位モデル)と同等のクオリティを、より少ないコンピューティングで担保できるとしている。
Gemini 1.5 Proは12万8000トークン(トークンはAIモデルが認識する情報の単位)のコンテキストウィンドウが標準で付属し、開発ツール「AI Studio」と機械学習プラットフォーム「Vortex AI」において、一部の開発者と企業ユーザー向けに提供が開始されている。限定プレビュー版では、最大100万トークンのコンテキストウィンドウも試用できるが、計算量が多く、レイテンシー改善のためにさらなる改善が必要だとしている。
同社では、Gemini 1.5の特徴として、次の5点を挙げている。
1.高効率なアーキテクチャ
TremsformerおよびMoEアーキテクチャに関する、最先端の研究に基づいて構築されたモデルである。
2.より拡張されたコンテキストと役立つ新機能
先述の通り、最大100万トークンに対応(Gemini 1.0では3万2000トークン)。トークンは単語、画像、動画、音声、またはコードの全体または一部にすることができ、多くの情報を取り込んで処理可能になったことで、出力の関連性・有用性が高まるとしている。
また、研究では最大1000万トークンのテストにも成功しているという。
3.膨大な情報に関する複雑な推論が可能に
例えば、アポロ11号の月面着陸に対する402ページの記録に基づいて、文書内にある会話、出来事、画像、詳細について推論するなど、プロンプト内の大量のコンテンツをシームレスに分析、分類、要約できる。
4.複数のモダリティの相互理解と推論の向上
動画など、さまざまなモダリティ(AIモデルにおけるモダリティとは、動画、画像、テキストといった情報の種類のことを指す)に対する高度な理解と推論が可能。例えば、44分間のバスター・キートンの無声映画に対して、プロットや出来事を正確に分析し、作中の小さなことがらについても推論できるという。
5.パフォーマンスの向上
Gemini 1.5 Proは、大規模言語モデル (LLM) の開発に使用されるベンチマークの87%で Gemini 1.0 Pro を上回り、同じベンチマークでGemini 1.0 Ultraとほぼ同様のレベルのパフォーマンスを発揮する。また、コンテキストウィンドウが増加しても高いレベルでパフォーマンスを発揮し、プロンプトで提供される情報から学習する「インコンテキスト学習」においても、優れた能力を有しているという。
うおおおおおおおおおおおおおおお
100万トークンだった そもそもトークンってなに?(´・ω・`) ビットコイン? そもそもトークンってなに?(´・ω・`) ビットコイン? ごちゃごちゃいろんなの作らないで
完璧なやつみんなで一つ作れよ Bardがめちゃくちゃダメだったからな。。これであかんかったらgoogle終わりや >>7
GPT(もちろんCopilotも)も元はといえばGoogle開発物の派生みたいなもんだし
今世間を騒がせてるAIの元祖はGoogleだぞ
あと今年中にAppleが自社開発だとされるAIを発表予定 > 動画など、さまざまなモダリティ(AIモデルにおけるモダリティとは、動画、画像、テキストといった情報の種類のことを指す)に対する高度な理解と推論が可能。例えば、44分間のバスター・キートンの無声映画に対して、プロットや出来事を正確に分析し、作中の小さなことがらについても推論できるという。
これ凄いよりなんか怖いな >>8
既にGeminiに切り替わってるし
Bard公開初期からずいぶんマシになってるよ
アップデートがかかり続けてるのと、あと時事問題に対応するように成った 無料版geminiはわりと良い
gpt3.5より好きかも >>9
あーそれもあったな
アンソロピックはOpenAIからのドロップアウト組から始まってるが
AmazonやGoogle勢とアライアンス組もうとしてるな >>11
理論と実践は違うからね
いかに消費者が望むものを作るかみたいなのはGoogleは得意ではないから >>11
AmazonはアレクサをAI使って改良してくれないかね >>18
学習するときに英語の文章を分割した単位だよ
aとかtheとか短い単語なら単語で分けるけどmovedならmove+edみたいに分けたりする >>12
サム・アルトマンの解任騒ぎがなあ
でもその時もMSの反応がヤバいほど早かった
世界一レベルのIT巨人がパトロンなのは強い >>6
文を一文字ずつAIに読ませると効率悪いから
よく出るパターンごとにまとめて一つの固まりとして認識させる
この固まりがトークン
ひらがなだけでぶんをかくともじになんのいみもないからりかいしづらいけど
漢字で文を書くことで文字から大まかな意味を伝えることができるようになるのと似ている
そしてトークン量は文章量に直結するので多い方がいい Gemini1.5試せる手段は無いかなーと昨日あたりちょっと模索してみたが
有料サブスクに入らないと無理だった
無料枠に降りてくるのを待つしかないねー ケンモジだったらOS戦争、ドスブイ戦争、ブラウザ戦争etc…見てきたでしょ
AI戦争にどこが勝つかわかるでしょ >>30
ジャップのAIなんて30年前で止ってるだろ サム・アルトマンじゃなくてサムを解任しようとしたイーリャなんとかさんがOpenAIの頭脳なのあまり指摘されないよな >>19
アレクサが自然文を理解して会話できるようになれば圧倒的な使い勝手になるのになぁ
特に物の検索とか今は予め登録されてる内容以外がゴミ過ぎる
「だぶりゅだぶりゅだぶりゅどっと〇〇からの翻訳によると~」←聞いたことと全く関係のない結果
自然文理解してそれなりの検索結果出してくれれば、簡単な検索は全部アレクサだけで済む様になるのに >>36
GPT自体は進化してる
GPT-4Turboまで来てて近く発表されるGPT-5でさらなるブレイクスルーがあると噂されている
無料枠のChatGPTが3.5だから今となっては見劣りするってことじゃないか? 文章目的でGPT契約してる人いるの?
一体何書かせてるんだよ、まさかガチの仕事で使ってるんじゃないだろうな Geminiは無料期間で有料プラン入ったけど今んとこはガチでゴミ
ChatGPTと同じ質問て比較してるけど、一度もいい回答したことないわ
特にコードを質問して回答をコピペしてコンパイル通ることはほとんどないレベル
Gemini Advancedって奴選んでるけどここ以外でなんか設定あるんかな あまりにも酷すぎるw OpenAIが初代から5年かけて育てたGPT4が、開発期間1年そこらのGeminiに部分的とはいえかなりの差で追い越されたのが今回なわけで
OpenAIの先行者としてのアドバンテージはなくなってきたな AIにはPDFを読み込んで内容要約して欲しいんだけど
それができるようになる日は来るんだろうか?
いちいち仕事の書類とか読んでられねぇ その直後Soraに話題を全部持っていかれるGeminiくん…… >>7
一般論として競争した方が発展は早いんじゃないか >>41
Gemini Advancedはまだ日本語対応してないらしい
Xで誰かが言ってた | 何について調べますか?
| ┌────────────┐
| | geminiを消す方法 |
| | |
| └────────────┘
| [ オプション(O) ] [ 検索(S) ]
|
`──────────┐ ┌───
, '´l, ..| ./
, -─-'- 、i_ |/
__, '´ ヽ、
',ー-- ● ヽ、
`"'ゝ、_ ',
〈`'ー;==ヽ、〈ー- 、 !
`ー´ ヽi`ヽ iノ
! /
r'´、ヽ
`´ヽノ >>41
今のGeminiの有料プランであるGemini AdvancedはGemini 1.0 Ultraのこと
>>1で発表されてるのはGemini 1.5 Pro
Gemini 1.5 Proの期間限定無料試用は可能だから試してくれない?
俺はサブスクの初期無料期間制度が嫌いなんでトライしてない 実用性ではGeminiの発表の方がインパクト強いけど、あの一貫性の維持レベルが数年分ぶっ飛んだsoraのインパクトが強烈過ぎた >>46
プログラムにかんしてとかは英語で質問してるよ
でもありえないほどトンチンカン
>>51
すぐにでも試したいけどどこにあるのかわかんないのよねw
設定画面なんかくそシンプルなんやけども >>54
「Google AI Studio」または「Vertex AI」経由でいけます 凄さを全部ユーザー体験できるサイトとして公開したchatgptと
凄さを全部説明できる動画をお披露目と同時に出したsora
の商売センスを見習えよ
俺の方が強くてさァ!
じゃねーよ >>55
Gemini自体に使い方聞いてみたけど、チャットとしては使えないって言われちゃったよ
Gemini 1.5のインスタンスを作ってってかんじなんかな。
You're right. While it would be amazing to interact with Gemini 1.5 directly in this chat interface, that's unfortunately not possible due to the inherent architectural and logistical barriers. Here's a breakdown of why:
Obstacles
Integration Complexity: Incorporating Gemini 1.5 into a chat style interface necessitates a sophisticated API integration to communicate seamlessly with the Google Cloud Platform environment where Gemini 1.5 resides.
Real-time Limitations: Large Language Models like Gemini 1.5 can become computationally intensive for real-time interactions. The speed and latency requirements for seamless chat functionality may not be feasible.
Context Management: Maintaining a coherent and persistent conversational context over sustained chat sessions with a large language model requires complex backend support. 携帯でGemini使って近所のコンビニって入れたらこいつが役に立つか経たないかすぐわかるよ やってみ >>38
アレクサもAIが入ってるって聞いて最初はこれ期待してたんだけどな
今はスマート家電にしか使ってないわ ■ このスレッドは過去ログ倉庫に格納されています