Nieuws

DeepSeek verbetert de wiskundige capaciteiten van het vProver-model om stellingen en bewijzen te kunnen oplossen.
Tokens per seconde Time to first token Thought for ... Bij de op DeepSeek R1 getrainde Qwen-modellen hebben we een derde grafiek toegevoegd, die aangeeft hoelang het model heeft geredeneerd ...
De meeste Qwen3-modellen zijn, of worden binnenkort, beschikbaar voor download via een 'open' licentie op AI-platforms zoals Hugging Face en GitHub. De modellen variëren in omvang van 0,6 miljard ...
De Chinese groep Alibaba deelde interessante gegevens over de versie Qwen 2.5-Max, die betere resultaten behaalde dan Llama van Meta en het V3-model van DeepSeek in verschillende tests.
Xiaomi brengt zijn eigen AI-model uit MiMo uit. Uit de benchmarks die de Chinese elektronicafabrikant deelt, blijkt dat het redeneermodel beter presteert dan o1-mini van OpenAI en de Qwen-modellen van ...
De Qwen3-serie omvat zes 'dense' modellen en twee 'Mixture-of-Experts' (MoE) modellen, die ontwikkelaars flexibiliteit bieden om next-generation toepassingen te bouwen voor mobiele apparaten, slimme ...