DeepSeek AI: চীনা স্টার্টআপ প্রযুক্তি বিশ্বকে কাঁপিয়ে দিচ্ছে

 DeepSeek AI: চীনা স্টার্টআপ প্রযুক্তি বিশ্বকে কাঁপিয়ে দিচ্ছে



 সোমবার, প্রযুক্তি-কেন্দ্রিক নাসডাক স্টক মার্কেট একটি বিশাল হিট নিয়েছে, 3% কমেছে - এটি দুই বছরের মধ্যে সবচেয়ে খারাপ। এই আকস্মিক হ্রাসকে দায়ী করা হচ্ছে চীনা AI স্টার্টআপ 'DeepSeek'এর দ্রুত উত্থানের জন্য, যেটি সম্প্রতি তার অত্যাধুনিক AI মডেলগুলি, 'DeepSeek-V3' এবং 'DeepSeek-R1' লঞ্চ করার পরে শিরোনাম হয়েছে৷ এই মডেলগুলি বিশ্বব্যাপী দৃষ্টি আকর্ষণ করেছে এবং এমনকি অ্যাপ স্টোরে সর্বাধিক ডাউনলোড করা অ্যাপ হিসেবে ChatGPT-কে ছাড়িয়ে গেছে। ওপেনএআই, গুগল এবং মেটার মতো বড় নামগুলির তুলনায় অনেক কম অর্থ নিয়ে কাজ করা সত্ত্বেও, ডিপসিক ক্ষেত্রের সেরাদের সাথে প্রতিদ্বন্দ্বিতা করতে সক্ষম হয়েছে।


ডিপসিক কি?

 ডিপসিক হল হ্যাংজুতে অবস্থিত একটি চীনা AI কোম্পানি, উদ্যোক্তা লিয়াং ওয়েনফেং দ্বারা প্রতিষ্ঠিত, যিনি হাই ফ্লায়ার নামে একটি হেজ ফান্ডের নেতৃত্ব দেন। Wenfeng 2019 সালে AI-তে কাজ শুরু করে, এবং DeepSeek এখন AI মডেলদের প্রশিক্ষণের জন্য ব্যবহৃত চিপ প্রযুক্তিতে HighFlyer-এর দক্ষতা থেকে উপকৃত হয়।  


 অন্যান্য AI কোম্পানিগুলির থেকে ভিন্ন, DeepSeek-এর মডেলগুলি 'ওপেন সোর্স', যার অর্থ তাদের ডিজাইনগুলি অন্যদের তৈরি করার জন্য অবাধে উপলব্ধ। কোম্পানির মডেল, DeepSeek-V3, মাত্র $5 মিলিয়ন দিয়ে তৈরি করা হয়েছিল, যা আমেরিকান কোম্পানিগুলি অনুরূপ প্রকল্পগুলিতে ব্যয় করে তার একটি ক্ষুদ্র অংশ।


 ডিপসিক মডেলগুলিকে কী বিশেষ করে তোলে?

 DeepSeek এর AI মডেলগুলি তাদের দক্ষতা এবং অনন্য ডিজাইন এর জন্য প্রশংসিত হয়। V3 মডেলটি মিক্সচার-অফ-এক্সপার্টস (MOE)  নামে একটি প্রযুক্তি ব্যবহার করে, যা একটি বড় সিস্টেমের পরিবর্তে সমস্ত কাজ করার পরিবর্তে বিশেষজ্ঞদের একটি দল একসাথে সমস্যা সমাধানের মতো কাজ করে।  


 DeepSeek-V3 14.8 ট্রিলিয়ন শব্দের উপর প্রশিক্ষিত ছিল এবং 'মাল্টি-হেড ল্যাটেন্ট অ্যাটেনশন (MLA)'নামে একটি নতুন কৌশল ব্যবহার করে, যা OpenAI-এর GPT-4-এর মতো মডেলের তুলনায় প্রশিক্ষণ ও চালানোর জন্য সস্তা এবং দ্রুততর করে তোলে। এটি ভাষা বোঝা এবং টাস্ক-সমাধানের মতো কাজগুলিতে নেতৃস্থানীয় মডেলদেরও পরাজিত করেছে।  


 তবে ডিপসিক সেখানে থামেননি। কোম্পানিটি দ্রুত আরেকটি যুগান্তকারী মডেল, "DeepSeek-R1" অনুসরণ করে, যেটি "চিন্তা" করার জন্য এবং ধাপে ধাপে সমস্যার সমাধান করার জন্য ডিজাইন করা হয়েছে এবং এর যুক্তি প্রক্রিয়া দেখানো হয়েছে। R1 গণিত, কোডিং এবং সাধারণ জ্ঞানের মতো ক্ষেত্রে OpenAI-এর শীর্ষ মডেলের প্রতিদ্বন্দ্বী—এবং এটি বিকশিত এবং ব্যবহার করার জন্য  90-95% সস্তা। এছাড়াও, এটি বিনামূল্যে এবং যে কেউ ব্যবহার বা পরিবর্তন করার জন্য উন্মুক্ত।


 ডিপসিক এত সস্তা কিভাবে?

 এআই মডেল প্রশিক্ষণের জন্য সাধারণত একটি ভাগ্য খরচ হয়, তবে ডিপসিক অর্থ সাশ্রয়ের উপায় খুঁজে পেয়েছে। ওপেনএআই-এর মতো মার্কিন সংস্থাগুলি সর্বশেষতম NVIDIA H100 GPU ব্যবহার করে, ডিপসিক পুরানো, কম শক্তিশালী NVIDIA H800 চিপগুলি ব্যবহার করে, যা সস্তা এবং আরও সীমিত৷ মার্কিন বাণিজ্য নিষেধাজ্ঞার কারণে এই পুরানো চিপগুলি বিশেষভাবে চীনে রপ্তানির জন্য তৈরি করা হয়েছিল।  


 DeepSeek এর ইঞ্জিনিয়াররা সৃজনশীল, সফ্টওয়্যার অপ্টিমাইজ করে এই সস্তা চিপগুলি থেকে সবচেয়ে বেশি পারফরম্যান্স ত্যাগ না করেই তৈরি করেছে৷ এটি করার মাধ্যমে, তারা সর্বশেষ হার্ডওয়্যার ব্যবহার করার বিশাল খরচ এড়ায়, প্রমাণ করে যে বিশ্ব-মানের AI তৈরি করতে আপনাকে বিলিয়ন খরচ করতে হবে না।


 

 ডিপসিকের সাফল্য একটি গেম-চেঞ্জার। এটি দেখায় যে শক্তিশালী AI নির্মাণের জন্য সর্বদা বিশাল বিনিয়োগ বা সর্বশেষ প্রযুক্তির প্রয়োজন হয় না। তাদের ডিজাইন খোলাখুলি শেয়ার করার মাধ্যমে এবং সীমিত সম্পদের মাধ্যমে যা সম্ভব তা প্রমাণ করার মাধ্যমে, DeepSeek প্রযুক্তি জায়ান্টদের চ্যালেঞ্জ করছে এবং AI শিল্পকে নতুন আকার দিচ্ছে।

একটি মন্তব্য পোস্ট করুন

নবীনতর পূর্বতন