কৃত্রিম বুদ্ধিমত্তার ট্রেনে উঠছে গুগল ব্যবহারকারীদের জন্য নিজস্ব টুল সহ। একটি সহকারী যা আপনাকে বিভিন্ন দিক নিয়ন্ত্রণ করতে এবং খুব বৈচিত্র্যময় ক্রিয়া সম্পাদন করতে দেয় তাকে মিথুন বলা হয় এবং এটি কীভাবে কাজ করে সে সম্পর্কে আমরা আপনাকে সবকিছু বলব। জেমিনি কৃত্রিম বুদ্ধিমত্তা হল একটি মডেল যা মাউন্টেন ভিউ কোম্পানি দ্বারা তৈরি করা হয়েছে যাতে মাইক্রোসফট, ওপেনএআই এবং এর মতো সেক্টরে প্রতিদ্বন্দ্বিতা করা যায়।
প্রস্তাব গুগল জেমিনি সার্চ ইঞ্জিন কোম্পানির সমর্থন রয়েছে, এর অর্থ অনেক অর্থ, সময় এবং পেশাদাররা এর বিকাশের সেবায় নিয়োজিত। মিথুনের প্রধান বৈশিষ্ট্যগুলি আমাদের বুঝতে দেয় যে কীভাবে কৃত্রিম বুদ্ধিমত্তা কাজ করে এবং এই সেক্টরে লড়াই করার জন্য তারা গুগলে কী ধরনের উদ্দেশ্য খুঁজছে। এর সাম্প্রতিক নিশ্চিতকরণ, ফেব্রুয়ারির শুরুতে, সেক্টরে এই প্রযুক্তির গুরুত্ব দেখায়।
কিভাবে Google Gemini কৃত্রিম বুদ্ধিমত্তা কাজ করে
El গুগল কৃত্রিম বুদ্ধিমত্তা মডেল জেমিনীর লক্ষ্য সমসাময়িক প্রযুক্তি শিল্পের সবচেয়ে প্রতিযোগিতামূলক খাতে নেতৃত্ব দেওয়া। এই মডেল একটি নিছক চ্যাটবট বা মত অ্যাপ্লিকেশন নয় গুগল বার্ড, কিন্তু তারা অ্যাপগুলি কাজ করে এমন সমস্ত প্রযুক্তি তৈরি করে৷ এই কারণেই এটি একটি গুরুত্বপূর্ণ অগ্রগতি এবং একটি সেক্টর যেখানে Google প্রচুর সময় এবং সংস্থান উত্সর্গ করছে৷
মিথুন হতে লক্ষ্য PaLM উত্তরসূরি, কৃত্রিম বুদ্ধিমত্তা মডেল যা বার্ডকে আজ শক্তি দেয়। ডেভেলপারদের দ্বারা প্রস্তাবিত কাজের পরিকল্পনায়, ধারণাটি হল যে একই অ্যাপ্লিকেশনের মধ্যে অল্প অল্প করে PaLM কে মিথুন দ্বারা প্রতিস্থাপিত করা হবে। এমনকি যখন আমরা একই AI চ্যাট বট ব্যবহার করি, প্রতিক্রিয়াগুলি ধীরে ধীরে উন্নত হবে, প্রতিক্রিয়াগুলি প্রস্তুত করার এবং তথ্য অনুসন্ধানের জন্য এই নতুন প্রোটোকল এবং প্রক্রিয়াগুলিকে অন্তর্ভুক্ত করে।
প্রাথমিক পরীক্ষাগুলো
Google Gemini অনেক প্রত্যাশা তৈরি করে কারণ প্রাথমিক পরীক্ষাগুলি প্রধান প্রতিদ্বন্দ্বীদের তুলনায় উচ্চতর ফলাফল দেখায়। গুগল এমনকি ওপেনএআই এবং জিপিটি-4কে ছাড়িয়ে গেছে, যদিও এই ধরনের প্রযুক্তির অগ্রগতি ধ্রুবক এবং ভবিষ্যতে আবার পরিবর্তিত হতে পারে। মিথুনের প্রস্তাব একটি মাল্টিমডাল মডেল। এটি পাঠ্য থেকে চিত্র পর্যন্ত বিভিন্ন ধরণের তথ্য বুঝতে পারে এবং অডিও এবং প্রোগ্রামিং কোডও প্রবেশ করা যেতে পারে। এটি আমাদেরকে একটি অত্যন্ত নমনীয় কৃত্রিম বুদ্ধিমত্তা মডেলের কথা ভাবতে দেয়, যা একটি পাঠ্যের অনুরোধ থেকে শুরু করে একটি পরিস্থিতি বা প্রাসঙ্গিক বিকাশের প্রশ্নগুলি বর্ণনা করার জন্য বিভিন্ন ফাংশনকে সহায়তা এবং সম্পাদন করার জন্য অত্যন্ত সুপারিশ করা হয়।
মিথুন কিভাবে কাজ করে?
মত অন্যান্য কৃত্রিম বুদ্ধিমত্তা মডেল, মিথুন প্রচুর পরিমাণে তথ্য অন্তর্ভুক্ত করে নিবিড়ভাবে প্রশিক্ষিত হয়। সমস্ত ইন্টারনেট থেকে ডেটা সংগ্রহ করা হয় এবং প্রশিক্ষণের অ্যালগরিদমগুলি এমনভাবে ডিজাইন করা হয়েছে যাতে ভাষা সিস্টেম ব্যবহারকারী যা বলে তা বুঝতে শেখে৷ তারপর, আপনার ভিতরে ইতিমধ্যেই প্রশ্ন এবং অর্ডারের তথ্য থাকবে এবং জেমিনি প্রাকৃতিক এবং জৈব বলে মনে হয় এমন লিখিত প্রতিক্রিয়া তৈরি করার দায়িত্বে থাকবে।
গুগল স্ক্র্যাচ থেকে মিথুন ডিজাইন. এটির ধারণা থেকে এটি একটি মাল্টিমোডাল মডেল, বিভিন্ন ধরণের প্রতিক্রিয়া এবং অনুরোধের প্রতি মনোযোগ দেয় যা একজন ব্যবহারকারী করতে পারে। এটিকে শুধুমাত্র টেক্সট ফরম্যাটে সাড়া দেওয়ার জন্য প্রশিক্ষিত করা হয়নি, তবে এর প্রশিক্ষণ নেটিভভাবে বিভিন্ন পদ্ধতির সমন্বয় করে। উদাহরণস্বরূপ, আমরা একটি লিখিত আদেশ বা বাস্তব সময়ে একটি অঙ্কন করতে পারি। এমনকি রিয়েল টাইমে অবজেক্ট লিঙ্ক করা এবং রিলেট করা, নির্দেশাবলীর উপর ভিত্তি করে গান সাজেস্ট করা এবং আরও অনেক কিছু করা সম্ভব হবে।
আলফাকোড 2
এটি একটি নাম কোড তৈরির জন্য নতুন সিস্টেম যা মিথুন পরিচয় করিয়ে দেয়। জটিল গণিতের পাশাপাশি কম্পিউটার বিজ্ঞান তত্ত্ব বোঝার উন্নতিতে সাহায্য করে। এটি মিথুনের কৃত্রিম বুদ্ধিমত্তাকে বৃহত্তর যুক্তির ক্ষমতা দেয় সেইসাথে প্রোগ্রামিং কোড বোঝার, "হ্যালুসিনেশন" এর সম্ভাবনা কমিয়ে দেয়। উত্তরগুলি তখন অনুরোধ করা ব্যবহারের ধরণের জন্য অনেক বেশি নির্ভরযোগ্য এবং ব্যবহারিক হয়ে ওঠে।
GPT এর সাথে পার্থক্য
মিথুন কৃত্রিম বুদ্ধিমত্তায় আমরা তিনজনকে পাব বিভিন্ন সংস্করণ: আল্ট্রা, প্রো এবং ন্যানো. প্রথমটি হল সবচেয়ে উন্নত এবং সম্পূর্ণ মাল্টিমডাল উন্নয়ন। জেমিনি প্রো ক্ষমতা এবং ফাংশনের পরিপ্রেক্ষিতে আরও সীমিত, অন্যদিকে ন্যানো হল মোবাইল অভিজ্ঞতা এবং নিম্ন-চালিত ডিভাইসগুলির উপর দৃষ্টি নিবদ্ধ করা সংস্করণ।
এমনকি কম শক্তির জন্য ডিজাইন করা, জেমিনি ন্যানো কৃত্রিম বুদ্ধিমত্তা সেক্টরে একটি সম্পূর্ণ বিপ্লব। এটি ডিভাইসের মধ্যেই ব্যবহার করা যেতে পারে এবং বাইরের অ্যাপস প্রয়োগ করার প্রয়োজন হবে না। সবচেয়ে পরিষ্কার উদাহরণ হল ChatGPT। কৃত্রিম বুদ্ধিমত্তা ব্যবহার করার জন্য, একটি অ্যাপকে AI সার্ভারের সাথে সংযোগ করতে হবে। কিন্তু গুগল চায় জেমিনি সরাসরি মোবাইলে ইন্সটল করুক এবং কোনো ধরনের সংযোগের প্রয়োজন নেই।
যখন Gemini Ultra চ্যাট GPT-4 এর মতো একই ক্ষেত্রে সরাসরি প্রতিদ্বন্দ্বিতা করে, Gemini Pro সরাসরি GPT 3.5 এর সাথে প্রতিদ্বন্দ্বিতা করবে। সবশেষে, জেমিনি ন্যানো-এর তুলনা করার কোনো মানে নেই কারণ এটিই প্রথম যে কোনো প্রযুক্তি বিকাশকারী সার্ভার সংযোগ ছাড়াই এবং স্থানীয় প্রভাবের সাথে তার কৃত্রিম বুদ্ধিমত্তাকে অন্তর্ভুক্ত করার লক্ষ্য রাখে। OpenAI এর বর্তমান ক্যাটালগে অনুরূপ বৈশিষ্ট্য সহ একটি পণ্য নেই।
আর একটি পার্থক্য গুগল জেমিনি একটি মাল্টিমডাল প্রকল্প হিসাবে জন্মগ্রহণ করেছিল এর ধারণায়, যখন চ্যাট জিপিটি পাঠ্য অনুরোধের ব্যাখ্যা করার জন্য ডিজাইন করা হয়েছে। মিথুনের সাথে আমরা আরও এক ধাপ এগিয়ে যাই, উত্তর এবং মিথস্ক্রিয়াগুলির সন্ধান করি যা একটি অঙ্কন, একটি ফটো বা একটি অডিও ফাইলের মতো উপাদানগুলি থেকে শুরু হয়৷
গুগল মিথুন কখন আসবে?
এটা আশা করা হচ্ছে যে পরের কয়েক মাস, এবং স্তম্ভিতভাবে, Google Gemini-এর তিনটি সংস্করণ বিশ্বের বিভিন্ন প্রান্তে আসতে শুরু করে৷ Gemini Pro এর ক্ষেত্রে, এটি ইতিমধ্যেই Google Bard-এ আসছে এবং স্পেনের মতো দেশগুলি এখন তাদের প্রশ্ন করতে পারে এবং নতুন অভিজ্ঞতা উপভোগ করতে শুরু করতে পারে।
তারপর এটি আসার আশা করা হচ্ছে বার্ড অগ্রিম, Gemini Ultra এর সাথে একটি উন্নত সংস্করণ। অগ্রিম শুধুমাত্র বছরের শেষে উপস্থিত হতে পারে, কিন্তু কোন সরকারী তারিখ নেই. জেমিনি ন্যানো সংস্করণের জন্য, পিক্সেল 8 প্রো মডেলগুলি প্রথম এটি গ্রহণ করবে এবং AICore নামে একটি পরিষেবাও অন্তর্ভুক্ত করা হবে যাতে অ্যাপ নির্মাতারা তাদের সরঞ্জামগুলিতে কৃত্রিম বুদ্ধিমত্তা ব্যবহার করতে পারে।
অবশেষে মিথুনও যোগ দেবেন বলে আশা করা হচ্ছে Google ইকোসিস্টেম থেকে অন্যান্য অনেক টুল. সার্চ ইঞ্জিন থেকে শুরু করে গুগল অ্যাডস টুলস, ডুয়েট এআই বা ক্রোম ওয়েব ব্রাউজার যা কৃত্রিম বুদ্ধিমত্তার ব্যাপক সুবিধা গ্রহণ করবে।