رونمایی یکی از قوی ترین مدلهای هوش مصنوعی باز
به گزارش سیب پال، شرکت «دیپ سیک» از مدل جدید هوش مصنوعی خود رونمایی کرده است که به نظر می آید یکی از قوی ترین مدلهای هوش مصنوعی باز تا به امروز باشد.
به گزارش سیب پال به نقل از ایسنا، مدل جدید هوش مصنوعی «دیپ سیک وی۳»(DeepSeek V3) که توسط شرکت «دیپ سیک» ابداع شده است، به توسعه دهندگان امکان می دهد تا آنرا برای بیشتر اپلیکیشن ها همچون اپلیکیشن های تجاری دانلود و اصلاح کنند.
به نقل از تک کرانچ، دیپ سیک وی۳ می تواند قشر بزرگی از کارها و وظایف مبتنی بر متن را مانند کدنویسی، ترجمه و نوشتن مقاله و ایمیل باتوجه به درخواست انجام دهد.
برپایه آزمایش های داخلی شرکت دیپ سیک، دیپ سیک وی۳ هم از مدلهای قابل دانلود «باز» در دسترس و هم از مدلهای «بسته» هوش مصنوعی که فقط از راه API قابل دسترسی هستند، بهتر عمل می کند. در زیرمجموعه ای از رقابت های کدنویسی که در پلت فرم «کدفورسز«(Codeforces) میزبانی می شوند، دیپ سیک وی۳ توانست بهتر از مدلهای دیگر مانند «Llama 3.1 405B» شرکت «متا»(Meta)، «GPT-4o» شرکت «اوپن ای آی»(OpenAI) و «Qwen 2.5 72B» شرکت «علی بابا»(Alibaba) عمل می کند.
دیپ سیک اظهار داشت که دیپ سیک وی۳ روی یک مجموعه داده متشکل از ۱۴.۸ تریلیون توکن آموزش دیده است. در علم داده، توکن ها برای نمایش بیت های داده خام استفاده می شوند. یک میلیون توکن معادل حدود ۷۵۰ هزار کلمه است.
باآنکه دیپ سیک وی۳ کاربردی ترین مدل نیست اما از برخی جهات یک موفقیت محسوب می شود. دیپ سیک توانست این مدل را با بهره گیری از مرکز داده پردازنده های گرافیکی H800 شرکت «انویدیا»(Nvidia) در حدود دو ماه آموزش دهد. این شرکت اشاره کرد فقط ۵.۵ میلیون دلار برای آموزش دیپ سیک وی۳ هزینه کرده که کسری از هزینه توسعه مدل هایی مانند GPT-4 است.
منبع: سیب پال
این مطلب را می پسندید؟
(0)
(0)
جدیدترین مطالب مرتبط در سیب پال
نظرات بینندگان سیب پال در مورد این مطلب