العقل الثاني العلني
استكشاف المواضيع: Multimodal
مقالات تحت وسم: Multimodal
إطلاق Kling 3.0: محرك الإبداع الشامل الذي سيحول الجميع إلى مخرجين
2026-02-04
رسمياً؛ Kling تطلق إصدارها الثالث والذكي 3.0، محولاً عملية صناعة الفيديو إلى تجربة سينمائية متكاملة تدعم تناسق الشخصيات، الصوت الأصيل، والجودة الفائقة.
Kimi K2.5 من Moonshot AI: نموذج متعدد الوسائط يركز على «العمل الحقيقي» (بحث عميق)
2026-01-30
تغطية معمّقة لإطلاق Kimi K2.5: ما الذي يقدمه كنموذج مفتوح متعدد الوسائط؟ وما الذي يميّزه في تحويل الصور/الفيديو إلى كود، وفي أنماط الوكلاء (Agent/Swarm)؟ وما الذي يجب التحقق منه قبل الاعتماد عليه؟
Agentic Vision في Gemini 3 Flash: عندما تتحول الرؤية من لقطة واحدة إلى تحقيق خطوة بخطوة
2026-01-29
ميزة جديدة من Google DeepMind تجعل فهم الصور عملية تكرارية (Think/Act/Observe) مدعومة بتنفيذ كود Python لزيادة الدقة وتقليل التخمين في التفاصيل الدقيقة.