- গুগল লেন্স ভিডিও অনুসন্ধান AI দ্বারা চালিত রিয়েল-টাইম প্রাসঙ্গিক উত্তর সক্ষম করে।
- ভিডিও রেকর্ড করার সময় ভয়েস বা টেক্সটের মাধ্যমে পরামর্শ করা সম্ভব, যা মিথস্ক্রিয়ার সম্ভাবনাকে প্রসারিত করে।
- প্রতিটি প্রশ্নের জন্য ছবি, অডিও এবং মাল্টিমোডাল প্রসঙ্গ ব্যাখ্যা করার জন্য এই বৈশিষ্ট্যটি জেমিনি মডেলের উপর নির্ভর করে।
Google লেন্স এটি আপনার মোবাইল ফোন থেকে তথ্য অনুসন্ধানের জন্য একটি অপরিহার্য গুগল টুল হয়ে উঠেছে, এখন একটি বিপ্লবী আপডেট সংহত করছে: কৃত্রিম বুদ্ধিমত্তার জন্য ভিডিও এবং প্রশ্নগুলির মাধ্যমে জোরে জোরে অনুসন্ধান করুন. এই বৈশিষ্ট্যটি ঐতিহ্যবাহী চিত্র অনুসন্ধান থেকে এক ধাপ এগিয়েছে এবং আমাদের চারপাশের বিশ্বের সাথে আমাদের যোগাযোগের পদ্ধতিতে আমূল পরিবর্তন এনেছে। এখানে আপনি বিস্তারিত ব্যাখ্যা এবং সহায়ক টিপস সহ এটি কীভাবে কাজ করে, এটি কীসের জন্য, ধাপে ধাপে কীভাবে এটি ব্যবহার করবেন, এর সুবিধা, সীমাবদ্ধতা এবং এর সমস্ত গোপনীয়তা আবিষ্কার করবেন।
গুগল লেন্স কী এবং মাল্টিমোডাল ভিডিও অনুসন্ধানের দিকে এর বিবর্তন কী?
আরম্ভ হওয়ার পর থেকে, গুগল লেন্স বস্তু, লেখা, প্রাণী, উদ্ভিদ, পণ্য বা স্মৃতিস্তম্ভ সনাক্তকরণের অনুমতি দেওয়ার জন্য আলাদা হয়ে উঠেছে। কেবল মোবাইল ক্যামেরাটি দেখিয়ে। এর সবচেয়ে জনপ্রিয় বৈশিষ্ট্যগুলির মধ্যে রয়েছে তাৎক্ষণিক টেক্সট অনুবাদ, গণিত সমস্যা সমাধান, QR কোড স্ক্যান করা এবং ফিজিক্যাল এবং অনলাইন উভয় স্টোরেই পণ্যের তুলনা করা।
সময়ের সাথে সাথে, গুগল লেন্স নতুন প্রযুক্তি একীভূত করছিল যেমন ভয়েস রিকগনিশন এবং মাল্টিমোডাল সার্চ, এবং গুগল ইকোসিস্টেমের অন্যান্য অ্যাপ যেমন ম্যাপ, ফটো বা ক্রোমে ব্যবহার করা যেতে পারে। এর কার্যকারিতা কেবল সেই সময়ে তোলা ছবিগুলির মধ্যেই সীমাবদ্ধ নয়, বরং এতে সংরক্ষিত ছবি, নির্বাচিত টেক্সট এবং এখন সরাসরি অ্যাপ থেকে রেকর্ড করা ভিডিওও অন্তর্ভুক্ত রয়েছে।
বর্তমানের প্রধান অগ্রগতি হলো ছোট ভিডিও বিশ্লেষণ করার ক্ষমতা, দৃশ্যের ব্যাখ্যা করা এবং ভয়েস বা টেক্সটের মাধ্যমে প্রশ্ন জিজ্ঞাসা করার অনুমতি দেওয়া, তাৎক্ষণিকভাবে সুনির্দিষ্ট এবং প্রাসঙ্গিক উত্তর পাওয়া।. এটি চিত্র অনুসন্ধানের প্রধান বাধা অতিক্রম করে, যেখানে একটি ছবি সর্বদা প্রশ্নের সম্পূর্ণ প্রসঙ্গ প্রদানের জন্য যথেষ্ট নয়।
ধাপে ধাপে গুগল লেন্সে ভিডিও এবং ভয়েস সার্চ কীভাবে ব্যবহার করবেন
- আপনার অ্যান্ড্রয়েড বা আইওএস ফোন থেকে অথবা গুগল সার্চ বারের ম্যাগনিফাইং গ্লাস আইকন থেকে গুগল লেন্স অ্যাপটি খুলুন।
- "আপনার ক্যামেরা দিয়ে অনুসন্ধান করুন" নির্বাচন করুন। আপনি যে বস্তু, দৃশ্য বা পরিস্থিতি পর্যালোচনা করতে চান তার দিকে ক্যামেরাটি তাক করুন।
- একটি ছোট ভিডিও রেকর্ড করতে ক্যাপচার বোতাম টিপুন এবং ধরে রাখুন (সাধারণত ২০ সেকেন্ড পর্যন্ত)। রেকর্ডিংয়ের সময়, আপনি যা দেখছেন তা সম্পর্কে জোরে জোরে একটি প্রশ্ন যোগ করতে পারেন। বিকল্পভাবে, ভিডিও রেকর্ড করার পরে আপনি প্রশ্নটি টাইপ করতে পারেন।
- কাজ শেষ হয়ে গেলে, গুগলের কৃত্রিম বুদ্ধিমত্তা আপনার প্রশ্নের ভিডিও এবং অডিও উভয়ই বিশ্লেষণ করবে, সবচেয়ে প্রাসঙ্গিক ফ্রেমগুলি নির্বাচন করবে এবং কয়েক সেকেন্ডের মধ্যে উত্তর দেবে।
রেকর্ডিংয়ের সময়, সিস্টেমটি "এই দৃশ্য সম্পর্কে জিজ্ঞাসা করতে এখনই কথা বলুন" বার্তাটি প্রদর্শন করে।. এই প্রক্রিয়াটি অভিজ্ঞতাকে অনেক বেশি স্বাভাবিক করে তোলে, কারণ আপনি যা জানতে চান তা সংকুচিত করতে পারেন, এমন বিশদ বিবরণ উন্মোচন করতে পারেন যা একটি একক ছবি বা পাঠ্য অনুসন্ধান সনাক্ত করতে পারেনি।
কী ধরণের উত্তর পাওয়া যায় এবং উন্নত ব্যবহারিক ব্যবহার
La উত্তরের বৈচিত্র্য এবং নির্ভুলতা ক্লাসিক চিত্র অনুসন্ধানের চেয়ে অনেক বেশি।, কারণ AI-এর আরও বেশি প্রেক্ষাপটে অ্যাক্সেস আছে এবং ভিডিওতে ভিজ্যুয়াল এবং মৌখিক বিবরণের মধ্যে সম্পর্ক স্থাপন করতে পারে। ব্যবহারের কিছু উদাহরণ এবং উল্লেখযোগ্য ব্যবহারিক উদাহরণ:
- চলমান বস্তু এবং প্রাণী সনাক্তকরণ: সক্রিয় পোষা প্রাণী, তাদের প্রাকৃতিক পরিবেশে থাকা প্রাণী বা চলমান যানবাহন রেকর্ড করার জন্য এবং একটি স্থির ছবিতে অলক্ষিত প্রজাতি, ব্র্যান্ড বা বৈশিষ্ট্য পরীক্ষা করার জন্য আদর্শ।
- স্থান এবং স্মৃতিস্তম্ভের স্বীকৃতি: একটি বর্গক্ষেত্র বা ভবনের একটি প্যানোরামিক দৃশ্য রেকর্ড করুন এবং এর ইতিহাস, স্থাপত্য বা আকর্ষণীয় তথ্য সম্পর্কে জিজ্ঞাসা করুন। এআই পর্যালোচনা, ঐতিহাসিক তথ্য এবং গুরুত্বপূর্ণ তথ্য ট্র্যাক করতে পারে।
- দোকানে পণ্য সম্পর্কে তথ্য প্রাপ্তি: আপনি কি আকর্ষণীয় কিছু দেখেন এবং দাম, মতামত বা বিকল্প জানতে চান? পণ্যটি রেকর্ড করুন এবং জোরে একটি প্রশ্ন জিজ্ঞাসা করুন। এই সিস্টেমটি ক্রয় লিঙ্ক, তুলনা এবং অন্যান্য ব্যবহারকারীদের অভিজ্ঞতা প্রদান করে।
- থার্ড-পার্টি ভিডিও কোয়েরি: দৃশ্যের গান, অভিনেতা, অবস্থান, রেস্তোরাঁ, অথবা যেকোনো দৃশ্যমান বা শ্রবণযোগ্য উপাদান শনাক্ত করতে আপনার টিভি, কম্পিউটার বা ট্যাবলেটের স্ক্রিন রেকর্ড করুন।
- শিক্ষা এবং সমস্যা সমাধানে সহায়তা: একটি পরীক্ষা, একটি গণিতের কাজ, অথবা একটি ভাঙা যন্ত্রের কাজ রেকর্ড করুন এবং সমাধান, ব্যাখ্যা, অথবা ধাপে ধাপে নির্দেশিকা জিজ্ঞাসা করুন।
- শিল্প ও প্রকৃতি অন্বেষণ: : কোনও শিল্পকর্ম, বিদেশী উদ্ভিদ, ভূতাত্ত্বিক গঠন, মেঘের ধরণ ইত্যাদি সম্পর্কে পরামর্শ করুন, তথ্য সম্প্রসারণের জন্য বিশদ ব্যাখ্যা এবং সংস্থান পান।
- চলার পথে তাৎক্ষণিক অনুবাদ: ভ্রমণকারীদের জন্য, এটি আপনাকে চলমান চিহ্ন, লেবেল, বা সাবটাইটেল রেকর্ড করতে এবং অনুবাদ গ্রহণ করতে দেয়, তা নির্বিশেষে যে চিহ্নটি ফোকাসের বাইরে আছে বা ছবিতে ধারণ করা কঠিন।
- কারুশিল্প এবং DIY প্রকল্প: আপনি উপকরণ এবং প্রক্রিয়া রেকর্ড করতে পারেন, পরবর্তী ধাপ সম্পর্কে প্রশ্ন জিজ্ঞাসা করতে পারেন, অথবা আপনার ভিডিওর প্রেক্ষাপট অনুসারে বিস্তারিত নির্দেশাবলীর অনুরোধ করতে পারেন।
- রান্নাঘর রেসিপি: উপকরণ বা রেসিপির প্রক্রিয়া দেখায় এবং প্রস্তুতি, রান্নার সময়, অথবা উপাদানের বিকল্প সম্পর্কে জিজ্ঞাসা করে।
লম্বা লেখা লেখার বা প্রযুক্তিগত বর্ণনায় সময় নষ্ট করার কোন প্রয়োজন নেই।. গুগলের মাল্টিমোডাল এআই-এর জন্য ধন্যবাদ, আপনার প্রেক্ষাপট অনুসারে একটি সুনির্দিষ্ট ওভারভিউ অ্যাক্সেস করার জন্য কেবল রেকর্ড করুন, দেখান এবং প্রশ্ন জিজ্ঞাসা করুন।
জেমিনি এবং এআই এর সংক্ষিপ্তসার: জাদুর পিছনে কৃত্রিম বুদ্ধিমত্তা
যে ইঞ্জিনটি এই ফাংশনটি সম্ভব করে তোলে তা হল জেমিনি, গুগলের উন্নত কৃত্রিম বুদ্ধিমত্তা মডেল যা ছবি, টেক্সট, অডিও এবং এখন সম্পূর্ণ ভিডিও বুঝতে সক্ষম।. এটা কিভাবে কাজ করে? যখন আপনি একটি ভিডিও রেকর্ড করেন এবং একটি প্রশ্ন জিজ্ঞাসা করেন, তখন জেমিনি প্রতিটি ফ্রেমের ফুটেজ বিশ্লেষণ করে, মূল দৃশ্যমান অংশগুলি সনাক্ত করে এবং সেই তথ্যগুলিকে আপনার প্রশ্নের সাথে ক্রস-রেফারেন্স করে, তা সে মৌখিক হোক বা লিখিত।
ফলাফলটি এই আকারে প্রদর্শিত হবে এআই ওভারভিউ, একটি পরীক্ষামূলক বৈশিষ্ট্য যা ওয়েবে উপলব্ধ তথ্য প্রক্রিয়া করে, স্পষ্টভাবে সারসংক্ষেপ করে এবং কয়েক সেকেন্ডের মধ্যে ডিভাইসের স্ক্রিনে প্রদর্শন করে। এটি অনুসন্ধানকে সত্যিকার অর্থে মাল্টিমডাল: AI ছবি, ভয়েস এবং প্রেক্ষাপটকে একত্রিত করে, যা পূর্বে একাধিক অনুসন্ধান বা বিশদ থেকে কঠিন বর্ণনার প্রয়োজন এমন প্রশ্নের সমাধানের অনুমতি দেয়।
কিছু ব্যবহারকারীর জন্য, বিশেষ করে যেখানে বৈশিষ্ট্যটি এখনও পরীক্ষামূলক, সেখানে "সার্চ ল্যাবস" বিকল্পটি চালু করার এবং গুগল অ্যাপ থেকে "এআই ওভারভিউ এবং আরও অনেক কিছু" সক্ষম করার প্রয়োজন হতে পারে। যদিও ইংরেজি ভাষাভাষী অঞ্চলে এর প্রচলন শুরু হয়েছে, অন্যান্য ভাষা এবং দেশে এর সম্প্রসারণ দ্রুত এগিয়ে চলেছে।
বাস্তব জীবনের উদাহরণ এবং ডেমো: গুগল লেন্স ভিডিও এবং ভয়েসের প্রতি কীভাবে সাড়া দেয়
মিশাল রহমানের মতো বিশেষজ্ঞদের রেকর্ড করা পরীক্ষায় ব্যবহারিক সম্ভাবনা দেখা গেছে, যিনি কয়েক সেকেন্ডের মধ্যে স্মার্টওয়াচ, খাবারের প্লেট বা শহুরে দৃশ্যের স্বীকৃতি নথিভুক্ত করেছিলেন। উদাহরণস্বরূপ, যখন ব্লুবেরির একটি থালা রেকর্ড করা হয়েছিল এবং জিজ্ঞাসা করা হয়েছিল যে কতগুলি আছে, তখন জেমিনি রিয়েল টাইমে সঠিক গণনাটি ফেরত দিয়েছিল। আরেকটি পরীক্ষায়, একটি স্মার্টওয়াচ রেকর্ড করে এবং এর মডেল এবং অপারেটিং সিস্টেম সম্পর্কে জিজ্ঞাসা করে, AI সঠিকভাবে বেশিরভাগ বিবরণ সনাক্ত করেছে, এমনকি যদি নির্দিষ্ট মডেলটি সামান্য পরিবর্তিত হতে পারে।
অতিরিক্ত পরীক্ষা-নিরীক্ষায়, উড়ন্ত পাখির প্রজাতি সনাক্ত করা, চলমান যানবাহন সনাক্ত করা, দৃশ্যে বস্তু গণনা করা এবং জটিল শিক্ষামূলক ব্যাখ্যা প্রদান করা সম্ভব হয়েছে। নির্ভুলতার হার ভিডিওর গুণমান এবং তীক্ষ্ণতার উপর নির্ভর করে, তবে উত্তরের গতি এবং উপযোগিতা স্থির চিত্র অনুসন্ধানের চেয়ে অনেক বেশি।
গুগল ইকোসিস্টেম এবং নতুন অনুসন্ধান পদ্ধতির সাথে একীকরণ
গুগল লেন্সের বিবর্তন কেবল মূল অ্যাপটিকেই উন্নত করে না, বরং গুগল ইকোসিস্টেম জুড়ে নতুন বৈশিষ্ট্যগুলিকেও শক্তিশালী করে।. কিছু উল্লেখযোগ্য ইন্টিগ্রেশন এবং সুবিধার মধ্যে রয়েছে:
- ইউটিউবে সরাসরি অনুসন্ধান করুন: অ্যাপের মধ্যে ভিডিওর উপাদানগুলি সনাক্ত করুন, যেমন স্থান, গান, অভিনেতা বা পণ্য, কেবল আপনার স্ক্রিন রেকর্ড করে।
- সমৃদ্ধ Chrome অভিজ্ঞতা: আপনাকে ওয়েব পৃষ্ঠাগুলি থেকে ভিডিও, ছবি বা টেক্সটের টুকরো নির্বাচন করতে এবং ব্রাউজার ছাড়াই তথ্য দেখতে দেয়।
- গতিতে অনুবাদ: ভ্রমণ বা পরিবর্তনশীল পরিস্থিতিতে চলমান চিহ্ন বা সাবটাইটেল অনুবাদ করতে ক্যামেরা এবং ভিডিও ফাংশন ব্যবহার করুন।
- স্মার্ট ক্রয়: পণ্য রেকর্ড করার মাধ্যমে, আপনি দোকানের সরাসরি লিঙ্ক, দামের তুলনা, পর্যালোচনা এবং রিয়েল-টাইম প্রাপ্যতা পাবেন, অনলাইন এবং অফলাইন কেনাকাটা অপ্টিমাইজ করে।
সীমাবদ্ধতা, ব্যবহারের প্রয়োজনীয়তা এবং গোপনীয়তা
ফাংশন এটি এখনও ক্রমান্বয়ে স্থাপনার পর্যায়ে রয়েছে।, তাই এর প্রাপ্যতা অঞ্চল, ভাষা এবং আপনার অ্যাকাউন্টে "AI ওভারভিউ" পরীক্ষা সক্ষম কিনা তার উপর নির্ভর করে। কিছু ক্ষেত্রে, ব্যবহারকারীকে সার্চ ল্যাবে নথিভুক্ত করতে হবে এবং ফ্লাস্ক-আকৃতির আইকনে ট্যাপ করে গুগল অ্যাপ থেকে সংশ্লিষ্ট পরীক্ষাগুলি সক্রিয় করতে হবে।
- ভিডিওর সর্বোচ্চ দৈর্ঘ্য: AI বিশ্লেষণের দক্ষতা নিশ্চিত করার জন্য ভিডিও সাধারণত ১০-২০ সেকেন্ডের মধ্যে সীমাবদ্ধ থাকে।
- প্রস্তাবিত গুণমান: ভালো আলোতে রেকর্ড করা এবং দৃশ্যের উপর সঠিকভাবে ফোকাস করার পরামর্শ দেওয়া হয়, কারণ প্রতিক্রিয়ার নির্ভুলতা পরিবেশের তীক্ষ্ণতা, ফ্রেমিং এবং স্বচ্ছতার উপর নির্ভর করে।
- গোপনীয়তাডিফল্টরূপে, AI মুখের স্বীকৃতি এড়িয়ে চলে এবং বস্তু, ক্রিয়া এবং প্রেক্ষাপটের উপর বিশ্লেষণকে কেন্দ্রীভূত করে, মানুষ নয়। তবে, সম্মতি ছাড়া ব্যক্তিগত তথ্য বা মানুষের তথ্য রেকর্ড করা এড়িয়ে চলাই ভালো।
- অস্পষ্ট উত্তর: বিভ্রান্তিকর, অস্পষ্ট, অথবা দ্রুতগতির ভিডিওগুলিতে, AI সঠিক সমাধানের পরিবর্তে আনুমানিক উত্তর বা পরামর্শ দিতে পারে। তবুও, বেশিরভাগ ক্ষেত্রেই উপযোগিতার স্তর খুবই উচ্চ।
গুগল লেন্সে ভিজ্যুয়াল ভিডিও অনুসন্ধানের মাধ্যমে, সম্ভাবনার এক দিগন্ত উন্মোচিত হয় যা আমাদের প্রশ্ন সমাধান, শেখা, তুলনা, কেনাকাটা এবং বিশ্ব অন্বেষণের পদ্ধতিকে রূপান্তরিত করে। এই AI-চালিত বৈশিষ্ট্যটি প্রতিটি পরিস্থিতির জন্য উপযুক্ত তথ্য সরবরাহ করে, একক ধাপে ভয়েস, ছবি, ভিডিও এবং প্রেক্ষাপট একত্রিত করে, ব্যবহারকারীদের বুদ্ধিমান অনুসন্ধানের ভবিষ্যতের আরও কাছে নিয়ে আসে। গুগল লেন্সের বিবর্তনের জন্য আমাদের সাথেই থাকুন এবং এই অগ্রগতির সুবিধা নিতে দ্বিধা করবেন না, যা আপনার হাতের তালুতে ভৌত এবং ডিজিটাল বাস্তবতার মধ্যে রেখা ঝাপসা করে দেয়।