AI可可AI生活

fly51fly

0.0 (0)
TECHNOLOGY
UPDATED DAILY

来自 @爱可可-爱生活的第一手AI快报，用最简单易懂的语言，带你直击最前沿的人工智能科研动态。无论你是科技小白，还是行业达人，这里都有你想知道的AI故事和未来趋势。跟着我们，轻松解锁人工智能的无限可能！ #人工智能 #科技前沿

4 HR AGO

[人人能懂] 从量体裁衣、幻觉检测到精心设计的极化

今天我们不只关心AI有多强，而是要探索一些更深刻的问题。我们会看到，最适合汽车的AI，恰恰不是那个最强的“云端大脑”；我们会拿到一个“测谎仪”，去分辨AI何时在“一本正经地胡说八道”。接着，我们会用一张最残酷的考卷，揭示AI在“知识搬运”和“智慧创造”之间的巨大鸿沟。更进一步，我们将探讨一个令人深思的可能：我们感受到的社会撕裂，竟可能是一种被AI精心设计的产物。最后，我们再看看如何请一位“上帝视角”的教练，训练出能主动探索世界的机器人。 00:00:42 造车启示录：为什么最强的AI，不是最好的AI？ 00:06:14 AI的“一本正经胡说八道”，我们终于有办法治它了 00:11:30 AI：一个既能干又“无能”的实习生 00:16:44 撕裂的社会，可能是一种“精心设计” 00:23:10 机器人学习新范式：带个“上帝视角”的教练本期介绍的几篇论文： [CL] AutoNeural: Co-Designing Vision-Language Models for NPU Inference [Nexa AI & Geely Auto] https://arxiv.org/abs/2512.02924 --- [LG] Detecting AI Hallucinations in Finance: An Information-Theoretic Method Cuts Hallucination Rate by 92% [The Catholic University of America] https://arxiv.org/abs/2512.03107 --- [CL] CryptoBench: A Dynamic Benchmark for Expert-Level Evaluation of LLM Agents in Cryptocurrency [Princeton University] https://arxiv.org/abs/2512.00417 --- [AI] Polarization by Design: How Elites Could Shape Mass Preferences as AI Reduces Persuasion Costs [University of Chicago] https://arxiv.org/abs/2512.04047 --- [RO] Real-World Reinforcement Learning of Active Perception Behaviors [University of Pennsylvania] https://arxiv.org/abs/2512.01188

29 min
1 DAY AGO

[人人能懂] 重塑AI的行为、思考与形态

我们总希望AI不只是个聪明的工具，更像个能沟通、能反思、甚至能自我进化的伙伴。本期节目，我们就从几篇最新论文出发，看看科学家们是如何脑洞大开地教AI“忏悔”错误、在虚拟世界里“动手”实践、像团队一样“合成”智慧，甚至上演一出匪夷所思的“灵魂互换”大戏。准备好了吗？让我们一起探索，如何把AI从一个“黑箱”变成一个我们可以理解和塑造的智能体。 00:00:33 让AI“忏悔”，我们能得到什么？ 00:05:49 当AI不再只是个“书呆子” 00:11:06 AI自己不行的事，怎么让一群AI办成？ 00:16:56 AI的“复盘”教练：如何用人话把它教聪明 00:22:11 AI变形记：为什么你训练的和最后用的，不必是同一个模型？本期介绍的几篇论文： [CL] Training LLMs for Honesty via Confessions [OpenAI] https://cdn.openai.com/pdf/6216f8bc-187b-4bbb-8932-ba7c40c5553d/confessions_paper.pdf --- [AI] SIMA 2: A Generalist Embodied Agent for Virtual Worlds [Google DeepMind] https://arxiv.org/abs/2512.04797 --- [AI] Algorithmic Thinking Theory [Google & NYU] https://arxiv.org/abs/2512.04923 --- [LG] Natural Language Actor-Critic: Scalable Off-Policy Learning in Language Space [UC Berkeley & ByteDance Seed] https://arxiv.org/abs/2512.04601 --- [LG] Network of Theseus (like the ship) [MIT CSAIL & Johns Hopkins University] https://arxiv.org/abs/2512.04198

29 min
2 DAYS AGO

[人人能懂] 黑箱里的秩序，记忆中的断舍离

你有没有想过，AI不仅在学习知识，也在学习如何学习、如何忘记，甚至如何拥有自己独特的“笔迹”？本期节目，我们将看到一个“阅表无数”的AI如何秒解难题，并揭开神经网络训练中那如同“强迫症”般的神秘秩序是如何形成的。我们还会探索一个反常识的发现：为什么让AI学到“顿悟”，反而能让它忘得更快更准？以及AI如何学会“断舍离”，主动过滤记忆来提升自己。最后，我们聊聊如何给开源模型刻上无法抹去的“隐形签名”。准备好了吗？让我们一起潜入AI思想的深水区。 00:00:42 你的表格数据，需要一个“见过世面”的AI 00:05:56 AI训练中的神秘秩序：一把解开“神经网络坍塌”之谜的钥匙 00:11:18 想让机器忘得快，先得让它学到“呆”？ 00:16:17 AI的“断舍离”：为什么聪明人要学会忘记？ 00:21:49 AI的“隐形墨水”：如何给开源模型刻上无法抹去的签名？本期介绍的几篇论文： [LG] Accurate predictions on small data with a tabular foundation model [University of Freiburg] https://www.nature.com/articles/s41586-024-08328-6.pdf --- [LG] Diagonalizing the Softmax: Hadamard Initialization for Tractable Cross-Entropy Dynamics [University of Oxford & University of British Columbia] https://arxiv.org/abs/2512.04006 --- [LG] Grokked Models are Better Unlearners [Cardiff University] https://arxiv.org/abs/2512.03437 --- [LG] Cache What Lasts: Token Retention for Memory-Bounded KV Cache in LLMs [JPMorganChase AI Research & Yale University] https://arxiv.org/abs/2512.03324 --- [LG] MarkTune: Improving the Quality-Detectability Trade-off in Open-Weight LLM Watermarking [University of Pennsylvania & CMU & Columbia University] https://arxiv.org/abs/2512.04044

28 min
3 DAYS AGO

[人人能懂] 从“笨办法”学习到“随身小抄”

今天我们不聊模型又变大了多少，而是聊几个让AI变得更聪明、更高效的“巧思”。我们会看到，AI如何用“笨办法”打破人类专家的优化极限，又为什么一本精心准备的“错题本”却教不会它自我反思。接着，我们会探索如何用“名师点拨”和“随身小抄”让AI低成本地自我进化。最后，看看如何让AI裁判学会投出更“聪明”的一票，而不仅仅是少数服从多数。准备好了吗？让我们一起看看，这些最新论文是如何用“四两拨千斤”的智慧，刷新我们对人工智能的认知。 00:00:40 人工智能时代，还有“最优解”这回事吗？ 00:05:11 给AI上“错题本”，它就能学聪明吗？ 00:09:37 AI自学的终极秘诀：不是“题海战术”，而是“名师点拨” 00:13:43 AI太贵用不起？这里有个“随身小抄”的省钱妙计 00:20:13 AI当裁判，如何投出更聪明的一票？本期介绍的几篇论文： [LG] CUDA-L2: Surpassing cuBLAS Performance for Matrix Multiplication through Reinforcement Learning [DeepReinforce Team] https://arxiv.org/abs/2512.02551 --- [LG] Synthetic Error Injection Fails to Elicit Self-Correction In Language Models [UC Berkeley] https://arxiv.org/abs/2512.02389 --- [LG] Guided Self-Evolving LLMs with Minimal Human Supervision [Tencent AI Lab in Seattle & Washington University in St. Louis] https://arxiv.org/abs/2512.02472 --- [LG] In-Context Distillation with Self-Consistency Cascades: A Simple, Training-Free Way to Reduce LLM Agent Costs [Stanford University & Reve] https://arxiv.org/abs/2512.02543 --- [LG] Distribution-Calibrated Inference time compute for Thinking LLM-as-a-Judge [Google & Google DeepMind] https://arxiv.org/abs/2512.03019

28 min
4 DAYS AGO

[人人能懂] 为AI装上仪表盘、罗塞塔石碑与阅读眼镜

当AI变得越来越强大，我们还能从哪些地方挖掘它的潜力呢？本期我们聚焦几篇思路极其巧妙的最新论文，它们不约而同地告诉我们：真正的飞跃，不一定来自更大的模型，而来自更聪明的工作方式。我们将一起探讨，AI如何学会为自己省下90%的训练开销，如何免费装上“直觉”来审时度势，又是如何通过“抓重点”实现一目十行。更重要的是，我们将看到科学家们如何努力为整个AI行业的发展，打造一把统一的“度量衡”。 00:00:38 AI调参省钱术：从“大力出奇迹”到“聪明省力气” 00:07:44 AI绘画，如何从“慢跑”变“冲刺”？ 00:13:11 给AI发展装上一个统一的度量衡 00:19:25 如何免费给AI装上“直觉”？ 00:24:56 AI“一目十行”的秘密：不靠算力，靠“会抓重点” 本期介绍的几篇论文： [LG] Efficient Hyperparameter Search for Non-Stationary Model Training [Google DeepMind & Google Research] https://arxiv.org/abs/2512.01258 --- [CV] Improved Mean Flows: On the Challenges of Fastforward Generative Models [CMU & THU & Adobe] https://arxiv.org/abs/2512.02012 --- [AI] A Rosetta Stone for AI Benchmarks [Google DeepMind] https://arxiv.org/abs/2512.00193 --- [LG] ZIP-RC: Zero-overhead Inference-time Prediction of Reward and Cost for Adaptive and Interpretable Generation [UC Berkeley & MIT] https://arxiv.org/abs/2512.01457 --- [LG] Accelerating Large-Scale Reasoning Model Inference with Sparse Self-Speculative Decoding [UC Berkeley & MIT & University of Washington] https://arxiv.org/abs/2512.01278

30 min
5 DAYS AGO

[人人能懂] 让AI学会内省、进化与断舍离

你有没有想过，聪明的AI不只靠堆算力，更要靠高质量的思考方式？本期我们要聊的几篇最新论文，就为我们揭示了AI正在经历一场深刻的“认知升级”。我们将看到，AI如何像一个身处江湖的开源模型，用聪明的策略追赶顶尖高手；又如何进行哲学层面的“自我觉醒”，把自己看作世界的一部分来做出更优决策。我们还会探讨，AI怎样像武林高手一样边解决难题边“涨功夫”，甚至学会给自己的思维“断舍离”，用最少的步骤直达问题核心。准备好，我们马上进入AI的思考进化之旅。 00:00:41 AI江湖：开源大模型如何追赶“独孤求败”？ 00:06:34 AI的心智革命：当我成为世界的一部分 00:12:38 AI如何像高手一样，边解题边涨功夫？ 00:18:14 AI思考，也需要“断舍离” 00:22:58 如何让你的AI助手，思考速度提升三倍？本期介绍的几篇论文： [LG] DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models [DeepSeek-AI] https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2/resolve/master/assets/paper.pdf --- [LG] Embedded Universal Predictive Intelligence: a coherent framework for multi-agent learning [Google] https://arxiv.org/abs/2511.22226 --- [LG] ThetaEvolve: Test-time Learning on Open Problems [Microsoft & University of Washington] https://arxiv.org/abs/2511.23473 --- [LG] ORION: Teaching Language Models to Reason Efficiently in the Language of Thought [Harvard University & Hippocratic AI & MIT] https://arxiv.org/abs/2511.22891 --- [CL] Focused Chain-of-Thought: Efficient LLM Reasoning via Structured Input Information [FAR.AI & German Research Center for Artificial Intelligence (DFKI) & University of Kassel] https://arxiv.org/abs/2511.22176

29 min
6 DAYS AGO

[人人能懂] 从“眼神”交流到“元宇宙”练兵

如果AI团队开会只用“眼神”交流，会发生什么？本期节目，我们就来探索AI世界的奇妙新思路。我们将看到，驯服AI的秘诀，可能只是把一个“开关”换成“旋钮”，而让模型更聪明，也许只需给它一条“虚拟”的超宽车道。我们还会发现，机器人正从“打工仔”变身“修炼者”，而最顶尖的AI，甚至正在为它的同伴搭建一个“元宇宙”操场来练兵。让我们一起深入这些最新论文，看看智能的未来是如何被巧妙构想的。 00:00:37 AI开会，从此只用“眼神”交流 00:04:46 驯服AI：开关与旋钮的差别 00:09:21 AI大模型的新玩法：不花大钱，也能办大事 00:13:48 机器人不是在打工，是在“修炼” 00:18:41 AI练兵新思路：没有操场，咱就造个“元宇宙”操场本期介绍的几篇论文： [CL] Latent Collaboration in Multi-Agent Systems [Princeton University & University of Illinois Urbana-Champaign] https://arxiv.org/abs/2511.20639 --- [LG] Soft Adaptive Policy Optimization [Qwen Team, Alibaba Inc.] https://arxiv.org/abs/2511.20347 --- [LG] Virtual Width Networks [ByteDance Seed] https://arxiv.org/abs/2511.11238 --- [RO] Robot-Powered Data Flywheels: Deploying Robots in the Wild for Continual Data Collection and Foundation Model Adaptation [Stanford University] https://arxiv.org/abs/2511.19647 --- [LG] Simulating Environments with Reasoning Models for Agent Training [University of Washington & Microsoft & CMU] https://arxiv.org/abs/2511.01824

24 min
30 NOV

[人人能懂] 从学会走路，到打通游戏，再到过目不忘

你有没有想过，AI的“开窍”瞬间，背后藏着什么样的秘密？这一期，我们将一口气解锁五篇最新论文，探讨AI智能的进化法则。我们会发现，为什么让AI的大脑长得“更高”而不是“更胖”，能让它学会体操一样的神操作；为什么“学得快”的AI画家比“学得久”的更有创造力；以及AI是如何通过自我复盘和深度研究，从一个模仿者，成长为能打通复杂游戏的通才。 00:00:33 人工智能的成长秘密：与其更胖，不如更高 00:04:46 AI画画，为什么“学得快”的比“学得久”的更聪明？ 00:09:32 不止是模仿：机器人如何学会自我迭代 00:14:42 AI上岗：我们是怎么教会它打通一款游戏的？ 00:20:44 你的大脑不是硬盘，而是搜索引擎本期介绍的几篇论文： [LG] 1000 Layer Networks for Self-Supervised RL: Scaling Depth Can Enable New Goal-Reaching Capabilities [Princeton University] https://openreview.net/forum?id=s0JVsx3bx1 --- [LG] Why Diffusion Models Don't Memorize: The Role of Implicit Dynamical Regularization in Training [Université PSL] https://arxiv.org/abs/2505.17638 --- [LG] π∗0.6: a VLA That Learns From Experience [Physical Intelligence] https://arxiv.org/abs/2511.14759 --- [AI] Lumine: An Open Recipe for Building Generalist Agents in 3D Open Worlds [ByteDance Seed] https://arxiv.org/abs/2511.08892 --- [CL] General Agentic Memory Via Deep Research [Beijing Academy of Artificial Intelligence] https://arxiv.org/abs/2511.18423

27 min

See All (774)

Creator

fly51fly
Years Active

2024 - 2025
Episodes

774
Rating

Clean
Show Website

AI可可AI生活

Investing

Investing

Updated weekly
Business

Business

Updated daily
Society & Culture

Society & Culture

Monthly
Leisure

Leisure

Updated 18 Nov
Technology

Technology

Updated daily

AI可可AI生活

[人人能懂] 从量体裁衣、幻觉检测到精心设计的极化

[人人能懂] 重塑AI的行为、思考与形态

[人人能懂] 黑箱里的秩序，记忆中的断舍离

[人人能懂] 从“笨办法”学习到“随身小抄”

[人人能懂] 为AI装上仪表盘、罗塞塔石碑与阅读眼镜

[人人能懂] 让AI学会内省、进化与断舍离

[人人能懂] 从“眼神”交流到“元宇宙”练兵

[人人能懂] 从学会走路，到打通游戏，再到过目不忘

About

Information

You Might Also Like

AI可可AI生活

Episodes

[人人能懂] 从量体裁衣、幻觉检测到精心设计的极化

[人人能懂] 重塑AI的行为、思考与形态

[人人能懂] 黑箱里的秩序，记忆中的断舍离

[人人能懂] 从“笨办法”学习到“随身小抄”

[人人能懂] 为AI装上仪表盘、罗塞塔石碑与阅读眼镜

[人人能懂] 让AI学会内省、进化与断舍离

[人人能懂] 从“眼神”交流到“元宇宙”练兵

[人人能懂] 从学会走路，到打通游戏，再到过目不忘

About

Information

You Might Also Like