Gemini については定期的に話題になりますが、Google の命名法と、同社がテストしてオンラインに公開しているすべてのツールを考慮すると、回避する方法を見つけるのは困難です。このファイルは、Gemini について知っておくべきすべてのこと、つまり、Gemini の用途、使用方法、AI の将来に対する Google の計画について説明するためにここにあります。
2023 年 12 月 6 日GoogleがGeminiを発表すると少々意外だった、サウンドLLM、あなた大規模言語モデル、フランス語の大規模な言語モデル。これはのモデルです人工知能それは力を与えることを可能にしますチャットボットとしてチャットGPT。ジェミニは、いくつかのバージョンでは「」と言われています。マルチモーダルこれは、テキスト、画像、ビデオ、オーディオなど、いくつかのタイプの要素を解釈できることを意味します。ジェミニについて理解する必要があるすべてがここにあります。
さらに進むには
LLMとは何ですか? ChatGPT、Google Bard などのエンジンはどのように動作しますか?
ジェミニ: Google の新しい LLM とは何ですか?
Gemini は、単純に言えば、最後の LLM です。グーグル、後者によると、すでに倒すことができますGPT-4、のLLMOpenAIこれは主に ChatGPT などで使用されます。副操縦士。その考えは、ラMDAなどPaLM-2Google は Gemini で新たな一歩を踏み出したいと考えており、これは長期的なプロジェクトであるようです。
昨年 12 月に発表された最初のバージョンは、32 の学術ベンチマークのうち 30 で GPT-4 を上回っていたため、これは機能しているようです。彼は数学と物理学の問題を解くのが非常に得意で、論理は苦手ですが、理解することも得意です。との競争はどうでしょうかGPT-5しかし ?可能であれば比較してみると面白いでしょう。

Google ジェミニ
モデル「マルチモーダル»、袈裟?
Google は自社のモデルを次のように説明しています。マルチモーダル» そしてこれが、Google が他の AI モデルを放棄した理由でもあります。これは、テキストだけでなく、コンピューター コード、オーディオ、画像、ビデオなど、さまざまな方法で環境を解釈できることを意味します。
用途とパフォーマンスの可能性を広げるのに十分です。これは、実際にはマルチモーダルではない OpenAI の GPT-4 との大きな違いでもあります。これは開発者にとって大きな課題です。
ジェミニとはどういう意味ですか?
GoogleはGeminiにちなんで名付けました汎用化されたマルチモーダル インテリジェンス ネットワーク。文字通り、それは「」を意味します汎用化されたマルチモーダル インテリジェンス ネットワーク»。私はラテン人ではありませんが、ジェミニ手段 "双子»: これがふたご座の由来です。コンピューティングでは、この名前はクライアント/サーバー通信プロトコルも指します。これは、Web 構築のステップとして機能するために作成されました。このプロトコル自体は、マーキュリー計画と有名なアポロ計画の間の中間段階である NASA のジェミニ計画 (その船も同じ名前でした) を参照していました。 GoogleのGeminiも、より大きなものへの一歩となる可能性があるだろうか?
Gemini Nano、Pro、Ultra の違いは何ですか?
双子座は3つに分かれるサイズ» 操作中に考慮される数十億のパラメータの数に応じて。サイズが大きいほど、モデルの実行に必要なリソースが多くなります (または、応答の生成に非常に時間がかかります)。
したがって、次のようになります。
- Gemini Nano: 最小のもので、スマートフォンなどのローカル デバイスで動作するように設計されています。デバイスの RAM に適応するために、Nano 1 (18 億パラメーター) と Nano 2 (32 億 5000 万パラメーター) に分割されています。
- Gemini Pro: アプリケーションに導入できる多用途モデル。
- Gemini Flash: Google API を使用するアプリケーション向けに設計された超高速バージョン。
- Gemini Ultra: Google ができることの究極。
前回の Google I/O 以来、最も先進的なバージョンは Gemini 1.5 Pro で、最大 100 万トークンの処理能力を提供します。これは、Gemini 1.0 Pro の 32,000 トークンをはるかに上回ります。
Google の命名法をナビゲートする方法: Bard は Gemini になった
生成テキスト AI の始まりには、Google Bard がありました。それはPaLM-2を実行するGoogleチャットボットでした。会期中に紹介されたツールGoogle I/O 2023そして、ジェミニに変身するまで、生涯を通じて実験的であり続けました。昨年12月以来、バードはジェミニを支持して会社のコミュニケーションから姿を消しました(アプリケーション、サイト、Googleによる言及)。平吟遊詩人のアプリケーションアシスタントジェミニに置き換えられただけです。名前の変更が関係している可能性がありますバードのプレゼンテーション中の失敗に対して:彼らはグーグルに1000億ドルの損失を与えた。
さらに、GoogleはAnthropicに巨額の資金を投資した、人工知能に特化したスタートアップで、独自のチャットボットを販売しています。クロード・アイ。
Gemini が Google アシスタントに代わる
テクノロジーの変更、名前の変更: これが Google の目指すものですGoogleアシスタント。息子アシスタントボーカル2016 年に発売されたこのプロジェクトは決して納得できず、開発はしばらく停滞しているようです。実際、今年は大きな新しい動きは見られませんでした。さらに悪いことに:一部の機能は Google によって削除されました。
しかし、Googleの技術的進歩はGeminiにもあります。 Googleがすべきことは、Geminiを優先してGoogleアシスタントを完全に排除することだ。後者は、より優れた音声アシスタントになる可能性があり、その設計により、より優れた機能が可能になります。理解する» ユーザーのリクエストを処理し、それに応答します。次のステップ: Gemini でボイスチャット機能を起動します。チャットGPT音声。
ジェマ: バージョン」開ける» by ジェミニ
昨年の2月、GoogleがGemmaを立ち上げた、Gemini の LLM をベースにした LLM のファミリー。目的は、Amazon や Microsoft に対抗するためにクラウド ソリューションを販売することです。 Gemma は無料で使用でき、「Gemini モデルの作成に使用されたものと同じ技術、研究、インフラストラクチャ要素を使用して構築されています」。 Google は次のようにさえ主張しています。Gemma は、そのサイズの他のオープン モデルと比較してクラス最高のパフォーマンスを備えています。»
したがって、Gemma 2B と Gemma 7B (20 億および 70 億のパラメーターの場合) があります。次のことも可能ですコンピュータ上でローカルに Gemma を実行する、たとえばChatRTX、LLM の使用を可能にする Nvidia のソフトウェア。
ジェミニの使い方は?
Google は義務を負っており、Gemini は徐々にそのサービスのあらゆる場所に干渉しています。チャットボットへのアクセス ポイントをいくつか紹介します。
アシスタント・ジェミニのやり方
以前は Google Bard であった Google Gemini 会話エージェントはブラウザ (gemini.google.com) で利用できますが、スマートフォン アプリケーションではまだ利用できません。このチャットボットは、LLM の中間バージョンである Gemini Pro を使用します。ただし、現時点では、セキュリティ上の理由から、フランスでは Gemini アプリケーションをダウンロードすることはできません。GDPR, Googleは欧州連合ではアシスタントを発売していない。
現在、Gemini (Advanced サブスクリプション付き) では、ジェミニプロ1.5、Gemini 1.0 Ultra に近い Gemini のバージョンで、GPT-4 の 128,000 トークンと比較して、100 万トークンという大きな処理能力を備えています。アシスタントが 10 時間のビデオや数万行のコードなど、非常に大量の情報を分析できるようにするのに十分な量です。
Pixel 8 の場合
Gemini Nano は以下で入手可能ですピクセル8などピクセル8プロ、すべてローカルで: すべての操作は Google サーバーではなくスマートフォン上で実行されます。インターネット接続を必要とせず、Google に情報を送信するには十分です。
アシスタントを使用すると、会話中に自動返信を生成できますワッツアップ(英語のみ)クラヴィーア Gboard。これを行うために、Gemini Nano は会話を参照しますが、画面のみが表示されます。現時点では WhatsApp のみが利用可能ですが、他のアプリケーションは後で提供される予定です。ボイス レコーダー (ピクセル レコーダー) で、Gemini に会話を要約するよう依頼できます。
Chrome の場合
でクロム、「」と入力できます。@ジェミニ画面上部のアドレスバーで「」をクリックし、その後にクエリを入力します。したがって、gemini.google.com サイトが起動し、クエリに応答します。
Googleメッセージ内
アシスタントも均等ですGoogle メッセージからアクセス可能: でアプリケーションSMS/MMSGoogle から、一部のユーザーの間で Gemini についての議論があります。重要な SMS を書いたり、友人に送信する画像を生成したりするよう依頼するには十分です。
しかし、このバージョンの Gemini (ブラウザベースのアシスタントほど強力ではありません) を使用して、料理のレシピ、次の夜の会話の話題など、あらゆることを尋ねることは間違いなくできます。現時点では、欧州連合内のユーザーに対する統合は計画されていません。
Google ワークスペースで
双子座は、真の生産性ツール、仕事のアシスタント、究極の大学になりたいと考えています。 Google が Gmail、ドライブ、ドキュメント、スプレッドシートなどのサブスクリプション版およびビジネス版である Workspace スイートにこれを導入しようとしているのは、このような状況にあります。例えば、Gmail は、ユーザーの要求に応じて、メールの読み取り、並べ替え、書き込み、整理を行うことができます。。
チャットボットは Google Chat の会話で呼び出すこともでき、プロジェクトに関するチーム全体の作業 (ドキュメント、ディスカッション、カレンダーなど) をフィードバックします。この機能には、より具体的な名前が付けられています。AI チームメイトそして非常に有望に見えます。
iPhoneのジェミニ?
Gemini アプリは App Store で入手できませんが、Google がそのアシスタントをアプリに導入する可能性は十分にあります。iPhone。噂によると、AppleはiOS上でGeminiを使用できるようにGoogleと交渉するだろう。スマートフォン メーカーは、生成 AI をできるだけ早く次のモデルに統合したいと考えています。アプリケーションや Web サイトを経由せずに、iOS でチャットボットに直接クエリを実行するには十分です。
これは、iOS 18 の大きな新機能の 1 つでもあり、iOS 18 はすでに iPhone オペレーティング システムの重要な進化となりつつあります。来年6月の期間中に対応WWDC 2024、その間にりんごiPhone 16の発表の数か月前に、iOS 17の後継バージョンのベールが解除されます。
Google の AI は、すべてをリストするのが不可能なほど多くのタスクを実行できます。詳細については、ぜひお読みください。ChatGPT の使用に関するファイル, これは双子座にも当てはまります。
テキストの要約
他の多くのチャットボットと同様、Gemini はテキスト コンテンツを要約するための非常に優れたツールです。メール、記事、ドキュメント ファイル: Google のサービスやデバイスに統合されることで、テキストによる要約の可能性がますます高まります。すぐに、たとえば、ボタン」このメールを要約すると、» が表示されますでGmail アプリケーション。
現時点では、この機能は一部の国では、Workspace ユーザーのみを対象に、Gmail のブラウザ版ですでに利用可能です。利点は、個別のメッセージだけでなく一連の電子メールを要約できることです。これにより、自分が参加していないがコピーされたディスカッションの本質を理解するのに十分です。
スポーツトレーニング
現時点では、スポーツ トレーニングのヒントは実験的なものであり、すぐには実現しません。いずれにしても、GoogleはすでにFitbit Labsの登場を発表している、チャットボットや仮想コーチなど、Gemini に基づく一連の機能。 Fitbit Labs は自然に統合されます。Fitbit アプリケーション、ブランドのコネクテッドウォッチとブレスレットに特化しています。
チャットボットは、いくつかのデータ (その日の活動や翌日の睡眠の質など) に関連するグラフを生成できます。これ "コーチ» また、現在の健康データに基づいてパーソナライズされたワークアウトをプログラムすることもできます。 Fitbit Premium に登録しているユーザー向けに予約する必要がある機能です。
ジェミニの拡張機能
ブラウザ版チャットボットでは最近、フランスで利用可能な拡張システム。これにより、チャットボットを他の Google サービス (Google フライト、Google ホテル、Googleマップ、YouTubeワークスペース スイート (ドキュメント、スプレッドシートなど) も同様です。アイデアは、できるようにすることです呼び出す» これらの拡張機能は、クエリを入力するときに使用され、Gemini が他の Google サービスから情報を取得します。フライト、マップ、さらには YouTube へのリンクがあれば十分です。 Google Workspace に関連する機能については、Gemini がメールやドキュメントを参照できるように、Gemini にアクセス権を付与する必要があります。
これらの拡張機能は、アシスタントのプライバシー設定でいつでも無効にできます。現時点ではサードパーティのアプリケーションは利用できませんが、将来的には拡張機能ストアが登場するでしょう。ChatGPT が提供するものと同様。また、YouTube Music が間もなく登場することもわかっています。その後、Google カレンダー、Google Tasks、Google Keep が Gemini の拡張機能となる予定です。
スマートフォンで詐欺を検知する
近い将来、Gemini Nano は、詐欺的であると思われる電話での会話や、詐欺にあまりにも似ている会話を検出できるようになるでしょう。この場合、LLM は Google サービスと通信せずに、スマートフォン上で直接動作します。
不審な会話を検知した場合には防止メッセージが表示されます。これがどのモデルで利用可能になるかはわかりません。Pixel でのみ、または以下の特定のデバイスでのみ発生する可能性があります。アンドロイド15。
あなたの写真を見つけてください
Gemini を活用したその他の今後の機能:写真を尋ねる、Googleフォトで。これにより、写真内のコンテンツを非常に正確な方法で検索できるようになります。ナンバープレートであれ、料理(レシピ付き)であれ、ジェミニはすべてを見つけることができるはずです。
それに加えて、チャットボットは、リクエストした写真の中から選択することもできます。たとえば、子供の水泳のすべての写真などです。
チャットボットにできないこと
最近のNGO デモクラシー・レポーティング・インターナショナルによる調査Gemini は他のチャットボットと同様に、欧州選挙に関する正確な情報を提供できないと述べました。彼らは投票がどのように機能するのかを説明しておらず、少ないデータから情報を生成しています。
さらに進むには
欧州選挙: Google の重要な役割
一方、Gemini は主に答え以外を定式化し、ユーザーが他の場所で情報を探すことを奨励します。この例は確かに孤立していますが、ジェミニの限界の 1 つを示しています。さらに、Googleは昨年3月に次のような決定を下した。ジェミニは今後欧州選挙に関する情報を提供しない。それとは別に、すぐにわかりますが、双子座はあなたが彼に伝えたいことを覚えているかもしれません、ChatGPTがしばらくの間行ってきたように。
Google サブスクリプションで最新バージョンの Gemini をお楽しみください
前回の Google I/O 中に、Google はジェミニアドバンスト: これは、同社の AI ツールに合わせて調整された Google One サブスクリプションのバージョンです。これには、Google One プレミアム プランのすべての利点が含まれていますが、それだけではありません。これにより、Google アカウントの 2 TB のストレージ容量 (無料アカウントの 15 GB の代わり) の恩恵を受けるだけでなく、何よりも Gemini の Google サービスへの統合、および Gemini Advanced を使用できる可能性から恩恵を受けることができます。 Gemini 1.5 Pro (LLM の最新バージョン)。サブスクリプションの料金は月額 21.99 ユーロで、Google は 2 か月間のトライアルオファーを提供しています。
Google はそのサイトで次のように明記しています。Gemini Advanced は、コーディング、論理的推論、特定の指示への従うこと、創造的なコラボレーションなどの非常に複雑なタスクに非常に効果的です。»
さらに進むには
Gemini Advanced: Gemini 1.5 Pro を搭載したチャットボットの究極バージョンとは何ですか?
ただし注意してください。Gemini Advanced は、フランス語で応答できる場合でも、英語でのみ利用可能で最適化されています。また、Gmail、ドキュメント、スライドでの Gemini の場合は、米国英語のみです。サブスクリプションにより、間もなく限定機能へのアクセスが提供されるようになります。その中には、実際の人と同じようにチャットボットとチャットできる Gemini Live があります。演繹的に、彼の話を中断することができ、私たちは彼にその場で声を変えるように頼むことができます。私たちもできますライブカメラを使用して Gemini と対話する。チャットボットは、あなたの好みや希望に合わせて旅行を計画するバックパッカーのガイドとしても機能します。
Google はまた、「Gem」や、自分で作成できるジェミニのパーソナリティを立ち上げることも計画しています。ジム仲間、副料理長、プログラミング パートナー、またはクリエイティブ ライティング ガイド»、会社を指定します。
なぜ双子座はフランスでこれほど限られた存在なのでしょうか?
Gemini のいくつかの機能は、フランス、より一般的には欧州連合では利用できません。 Googleが旧大陸でAIツールを立ち上げるのを妨げているのは主に欧州の法律だ。まず第一に、データ保護があります。Gemini が進歩するには、ユーザーとの会話を使用する必要があります。これにより、チャットボット ユーザーのデータ保護に懸念が生じる可能性があります。
次に、デジタル市場法: Google が Gemini を大規模に導入した場合、同社は特定のルールを遵守するよう強制される可能性があります。とりわけ、Gemini は他の Google サービス (YouTube、マップ、ワークスペースなど) を利用できなくなりました。ただし、このツールの強みはここにあり、会社の他のサービスに接続できることです。
最後に、AI法: 昨年 3 月に議会が合意した文書で、特に生成 AI を規制することを目的としています。来年7月までに正式に批准されるはずだ。 Googleに対し、Geminiの秘密(トレーニングやアルゴリズムなどに使用されるコンテンツ)を欧州委員会に明らかにするよう強制する文書。透かしツールによって生成されたコンテンツ (テキストと画像が人工的なものであることを確認できるようにする)。

Google ジェミニ

Google ジェミニ