记录团队成长点滴以及对技术、理念的探索,同时我们乐于分享!

3523
只是突然很好奇,已经造出了三艘航母,为何不能按照这样的模板,批量建造航母呢?

2025-06-18 查看(1000)

大家有没有发现一个非常诡异的事情,你看055都下了两大锅饺子
3523
如何评价MiniMax推出的全球首个开源大规模混合架构的推理模型MiniMax-M1,其有何技术优势?

2025-06-18 查看(1000)

OpenAI CEO 奥特曼前两天发了一篇博文,名字叫「温和
3523
qwen3-0.6B这种小模型有什么实际意义和用途吗?

2025-06-17 查看(1000)

0.5b 这种才是最有用的,因为它可以万能地微调成单一小任务
3523
新疆机票价格暴涨,上海飞乌鲁木齐往返超 6000 元,为什么旅游旺季还没到价格就飞涨?新疆旅游有多火?

2025-06-17 查看(1000)

我能想到的原因,有4.5个。 原因1:大美新疆,当得起旅游
3523
伊朗这次让以色列打惨了,这个国家还能挺过来吗?

2025-06-18 查看(1000)

实际上,以色列要惨得多。 大家没法理解“体量”的意义。
3523
如何评价Google刚刚发布的 Gemini Diffusion? 会代替自回归模型成为下一代模型吗?

2025-06-17 查看(1000)

首先谷歌的 llm diffusion 和之前发布的 llm