OrangeBot.AI Digest — 2025-06-16
55 headlines across 8 sources, aggregated for this day.
Hacker News(15)
- Snorting the AGI with Claude Code (kadekillary.work)
- Show HN: Chawan TUI web browser (chawan.net)
- Show HN: Canine – A Heroku alternative built on Kubernetes (github.com)
- Getting free internet on a cruise, saving $170 (angad.me)
- Darklang Goes Open Source (blog.darklang.com)
- Benzene at 200 (www.chemistryworld.com)
- Salesforce study finds LLM agents flunk CRM and confidentiality tests (www.theregister.com)
- WhatsApp introduces ads in its app (www.nytimes.com)
- Working on databases from prison (turso.tech)
- Show HN: Zeekstd – Rust Implementation of the ZSTD Seekable Format (github.com)
- Tesla blows past stopped school bus and hits kid-sized dummies in FSD tests (www.engadget.com)
- Occurences of swearing in the Linux kernel source code over time (www.vidarholen.net)
- Start your own Internet Resiliency Club (bowshock.nl)
- Nanonets-OCR-s – OCR model that transforms documents into structured markdown (huggingface.co)
- Is gravity just entropy rising? Long-shot idea gets another look (www.quantamagazine.org)
GitHub Trending(12)
- microsoft / fluentui-system-icons
Fluent System Icons are a collection of familiar, friendly and modern icons from Microsoft.
- anthropics / anthropic-cookbook
A collection of notebooks/recipes showcasing some fun and effective ways of using Claude.
- anthropics / prompt-eng-interactive-tutorial
Anthropic's Interactive Prompt Engineering Tutorial
- Shubhamsaboo / awesome-llm-apps
Collection of awesome LLM apps with AI Agents and RAG using OpenAI, Anthropic, Gemini and opensource models.
- immich-app / immich
High performance self-hosted photo and video management solution.
- huggingface / lerobot
🤗 LeRobot: Making AI for Robotics more accessible with end-to-end learning
- gtsteffaniak / filebrowser
📂 Web File Browser
- zen-browser / desktop
Welcome to a calmer internet
- linshenkx / prompt-optimizer
一款提示词优化器,助力于编写高质量的提示词
- virattt / ai-hedge-fund
An AI Hedge Fund Team
- panaversity / learn-agentic-ai
Learn Agentic AI using Dapr Agentic Cloud Ascent (DACA) Design Pattern and Agent-Native Cloud Technologies: OpenAI Agents SDK, Memory, MCP, A2A, Knowledge Graphs, Dapr, Rancher Desktop, and Kubernetes.
- YaLTeR / niri
A scrollable-tiling Wayland compositor.
Product Hunt(15)
- Spotted in Prod
The very best of iOS
- AgentX 2.0
Build your own cross-vendor multi-agent AI team
- Wonderish
Canva of Vibe Coding
- Fluidworks
SaaS onboarding agent that talks , clicks, and guides users
- Granola for Windows
The whole team can use Granola together, wherever they work
- Rewrait
Select, improve, replace
- SendStock AI
Instantly Generate Perfect Metadata for stock
- Tiptap DOCX Import & Export
Enhanced DOCX conversion for your Tiptap editor
- Canine
Host with the power of Kubernetes, simplicity of Heroku
- Audio Overview
Listen to your Google Search results
- Spatial Video Editor for Vision Pro
Create and Edit Spatial Videos in Spatial Media Toolkit
- Calling Clones
Build a team of clones! You will never be alone!
- Hunyuan3D-2.1
From images to high-fidelity 3D with PBR materials
- Keepfully 2.0
Keep track of money and objects you lend or borrow.
- SlideScript
Transform slides into speaker notes in seconds
Solidot(13)
- 英国连锁店的面部识别系统错误识别一位女性为小偷
一位英国女子被面部识别系统错误识别为偷盗了 10 英镑商品的小偷。 Danielle Horan 于 5 月和 6 月被英国连锁店 Home Bargains 的两家门店拒绝进入。第一次遭遇此事时她以为对方在开玩笑,在众目睽睽之下她不知所措。在抗议之后,门店经理建议她联络向连锁店提供面部识别技术的 Facewatch 公司。6 月 4 日她陪同母亲去了另一家 Home Bargains 门店,再次被店员围住要求离开,有了上次经验的她要求对此给出解释。在多次向 Facewatch 和 Home Bargains 发送电邮后,她才知道在 5 月 8 日她被指控偷了 10 英镑的卫生纸,在检查银行账户后她确认自己付款了。Facewatch 最后回应他们在审查之后确认她没有盗窃。该公司辩解称它依赖于门店提供的信息。公民自由运动组织 Big Brother Watch 的 Madeleine Stone 表示收到了超过 35 人的联络,投诉被错误列入了面部识别监视名单。她表示,英国在历史上一直认定,在被证明有罪之前你是无辜的;但当算法、摄像头和面部识别系统介入时,你就先被定罪了。
- 纽约州开始要求雇主披露裁员是否是 AI 导致的
纽约州开始要求雇主披露 AI 是否是裁员的原因。新要求适用于纽约州现有的 Worker Adjustment and Retraining Notification (WARN)系统,于今年三月生效。纽约州是美国第一个要求披露此类信息的州,此举将有助于监管机构了解 AI 对劳动力市场的影响。雇主如果要大规模裁员或者关闭工厂,他们需要提前至少 90 天通过 WARN 系统填写表格,最新的变化就是在表格里添加了一个勾选框,企业被要求勾选“技术创新或自动化”是否是裁员的原因。如果勾选了该选项,企业将会被引导到一个二级菜单,要求选择导致裁员的具体技术,是 AI 还是机器人。
- YouTube 和 Spotify 出现假专辑和 AI 生成音乐
YouTube 和 Spotify 开始涌现 AI 生成的假音乐。法国国际作家和作曲家协会的一项研究估计,到 2028 年 AI 生成音乐的收入将增至 40 亿美元,占流媒体平台总收入的 20%。消费者面临的问题是,他们难以区分哪些音乐是人工哪些是 AI 生成。在最大的音乐流媒体平台 Spotify 的社区论坛,用户呼吁对 AI 生成音乐进行清晰标记,并为用户提供屏蔽此类音乐的选项。该平台尚未制定此类政策。YouTube 则规定,如果内容是 AI 生成创作者需要予以披露。YouTube 表示如果它知情可能会对内容进行标记甚至予以删除。Spotify 联席总裁兼首席产品和技术官 Gustav Söderström 称,流媒体对内容的限制通常与版权侵犯有关。但在 AI 时代,AI 生成内容是否构成侵权还有很多争论。
- Meta 的大模型 Llama 3.1 能回忆《哈利波特》第一部 42% 的内容
来自斯坦福、康奈尔和西弗吉尼亚大学的计算机科学家和法律学者组成的团队上个月在预印本平台 arxiv 上发表了一篇论文,分析了五种开放权重模型能否重复 Books3 中的文本。这五种模型三种来自 Meta,另外两种分别来自微软和 EleutherAI,而 Books3 是用于训练大模型的流行书库,其中很多仍然受到版权保护。研究人员将 36 本书分成有重叠的 100 token 段落,使用前 50 token 作为提示词,计算接下来 50 token 与原文相同的概率,如果逐字复述的概率超过五成,研究人员就将该段落标记为“已记住”。结果显示,Meta 在 2024 年 7 月发布的参数规模中等的模型 Llama 3.1 70B 能记住《哈利波特》第一部 42% 的内容,相比下 Meta 在 2023 年 2 月发布的参数规模相似的模型 Llama 1 65B 只能记住 4.4%。研究人员发现,相比冷门书籍,Llama 3.1 70B 更可能重复热门书籍如《霍比特人》和乔治奥威尔《1984》,它对大部分书籍的记忆量远高于其它模型。
- X.Org Server 项目回滚了大量代码
在一位心怀不满的开发者被驱逐创建分支另立门户 X11Libre 之后,X.Org Server 项目的 Git 库最近几天的活跃度大增,主要目的是回滚有问题的代码。部分回滚与 X11Libre 开发者在被驱逐前递交的代码有关,部分与不正确处理版权和许可通知有关,还有部分是新补丁导致功能破坏有关。
- 女孩的数学表现从上学起开始落后
在世界各地,十几岁男孩的数学测试表现优于女孩,而男性更有可能从事与数学相关的职业。为了解上述差距的原因,法国研究人员进行了探索。研究涵盖了4个群体,即2018年、2019年、2020年或2021年在法国上一年级的所有儿童。这相当于近300万名5至7岁的儿童。他们在全法国证实了这一发现——数学性别差距出现在所有人群、社会经济群体、地区和学校类型中。研究人员利用大数据分析发现,是正规教育的开始,而不是年龄引发了这种差距。法国儿童通常在6岁那年的9月开始上学。2018年入学的法国所有儿童的测试结果折线图显示,在一年级开始时,男孩和女孩的平均水平相似,最高和最低百分位数的男孩略多;在二年级开始时,性别差距变大。研究人员指出,这表明是儿童上学后所处的环境,而不是兴趣或能力方面的先天差异引发了数学性别差距。此外,婴幼儿则不分男女,对数字和逻辑的掌握情况非常相似。`研究人员表示,引发数学性别差距的一个可能原因是教师和家长传递的刻板印象,即男孩在数学方面比女孩表现好,或者男孩因天赋获得成功、女孩因努力获得成功,从而打击了女孩的信心。
- 吃水果和蔬菜与高质量睡眠相关
根据发表在《Sleep Health》期刊上的一项研究,吃水果和蔬菜与高质量睡眠相关。在之前的观察性研究中,水果和蔬菜的摄入量高与自我报告的整体睡眠质量更好相关,这项新研究首次得出了给定一天的饮食选择与当晚客观测量的睡眠质量之间的时间关系。参与这项研究的健康年轻人通过一个应用程序报告了他们每天的食物摄入量,并佩戴了一个手腕监测仪,让研究人员能够客观地测量他们的睡眠模式。研究人员发现,每天的饮食与第二晚睡眠的显著差异相关。白天吃更多水果和蔬菜的参与者往往在同一天晚上睡得更深、更不间断,吃更多健康碳水化合物(如全谷物)的参与者也一样。研究人员估计,与不吃水果或蔬菜的人相比,吃 CDC 推荐的每天五杯水果和蔬菜的人的睡眠质量可以提高 16%。研究人员称,16% 是一个非常显著的差异。
- 饥饿细菌会杀死并吞食其邻居
研究人员在《科学》期刊上报告,当营养匮乏、资源短缺的时候,部分细菌会杀死周围的同类,然后一点点地把对方吃掉。细菌会使用“第六型分泌系统”(T6SS),是一种看起来像微型鱼叉枪的装置,去刺穿周围的其他细胞,并注入致命毒素,使对方细胞破裂而死。以往科学家认为,T6SS 是细菌在拥挤环境中用来清除竞争者的“武器”,目的在于“争地盘”。但最新研究表明,这套系统不仅可以“打仗用”,还能“进食用”。当营养匮乏、无力独自生长时,细菌会精准调控 T6SS,有目的地猎杀邻居,从中“榨取”营养,维持自身生存。科学家分析了全球海洋中不同环境的细菌基因数据,发现类似的武器系统广泛存在。
- 澳大利亚鹦鹉学会开饮水器喝水
科学家发现,在澳大利亚悉尼西部的郊区,一群凤头鹦鹉学会了操作人类使用的饮水器,并通过一系列复杂的旋转和按压动作,将水流引入嘴中。这种行为在其他任何鸟类中都未曾被观察到,并且正在悉尼西部的凤头鹦鹉种群中传播。研究人员在一台饮水器附近安装了两台动作感应相机。在超过一个月的时间里,相机记录下了近 14 小时凤头鹦鹉围绕饮水器活动的画面。研究人员从中识别出了 525 次不同的饮水尝试。每只凤头鹦鹉在具体操作方式上略有不同,但总体策略一致:它们会用一只或两只脚踩住饮水器的旋转把手,然后降低身体重量以顺时针方向旋转把手,并防止其弹回原位。当水流从出水口涌出时,鹦鹉便低头啜饮。那么,在已经有水坑、溪流等自然水源的情况下,为什么这些凤头鹦鹉会选择去使用饮水器呢?研究人员推测,也许它们偏爱饮水器提供的更为纯净的水源,抑或是饮水器较高的位置有助于它们观察是否有鹰隼等捕食者接近。
- 山东傅家遗址确认为母系社会
发掘于上世纪八九十年代的山东傅家遗址被确认为母系社会。傅家遗址发现了中国最早的开颅手术实例,其随葬品极少、生产力水平低下、几乎不见贫富差距等特征,与现代民族学对母系社会组织的认知高度契合。傅家遗址距今约 4750~4500 年,研究人员分析发现,傅家遗址南区的 46 个个体中有 44 例被认为源自单一母系祖先。北区的情况类似。通过结合南北两区基因与发掘信息,一个原始村落的面貌逐渐清晰:村落由两个相距约 400 米的母系氏族组成,氏族拥有自己的公共墓地,氏族之间长期保持通婚关系。在长达 250 年的时间内,两个氏族一直严格遵循“随母葬”的制度,青少年与成年男性均严格埋葬于出生时所在氏族墓地。
- 抓取 Web 内容的 AI 机器人流量难以获利
跟踪 AI 机器人抓取 Web 内容的 TollBit 报告,在 266 个网站中检索增强生成(Retrieval-Augmented Generation 或 RAG)机器人抓取流量已超过了训练机器人的抓取流量,RAG 机器人的抓取量从去年四季度到今年一季度增长了 49%。而这些机器人程序日益无视网站的 robots.txt,一个季度内绕过 robots.txt 的比例从 3.3% 升至 12.9%。RAG 机器人流量的增长反映了用户越来越多的通过聊天机器人如 ChatGPT 而不是 Google 去执行 Web 搜索。TollBit CEO 兼联合创始人 Toshit Panigrahi 表示,这一趋势意味着网站需要重新定位去面向机器人访客而不是人类访客。但对内容出版商而言问题是机器人不会付钱人类则可能会付钱,所以如何获利成为一大难题。AI 公司通常会以合理使用的名义拒绝支付任何费用,它们的 AI 机器人还会无视限制绕过屏蔽。
- 人类首次拍摄到太阳南极
尽管人类利用望远镜观察太阳已超过四百年,但一直以来我们都只能从地球绕日轨道面上观察太阳,无法看清楚太阳两极的样貌。由 ESA 主导的太阳轨道卫星(SolO)首次传回了太阳的南极影像,独特视角或将改变我们对太阳磁场、太阳活动周期以及太空天气运作方式的理解。过去的太阳探测器不论是环绕地球或是太阳,几乎都是配置在黄道面附近,与太阳赤道面的夹角不会超过7度,使得太阳两极成为观测死角。虽然 ESA 曾与 NASA 合作利用尤利西斯号探测器,以 79 度的绕极轨道观测太阳风与磁场,但并没有搭载任何望远镜与相机,所以太阳两极的活动样貌至今仍没有人见过。ESA 在 2020 年发射太阳轨道卫星(SolO),除了太阳风与磁场观测仪器之外,还搭载了偏振和日震成像仪(PHI)、极紫外线成像仪(EUI)以及日冕环境光谱成像仪(SPICE),试图用高倾角轨道来捕捉太阳两极的活动影像。
- 因 AI 科技巨头的间接碳排放自 2020 年以来增长了 50%
根据国际电联(ITU)的报告,因 AI 的使用四大科技巨头亚马逊、微软、Alphabet 和 Meta 的间接碳排放自 2020 年以来增长了 50%。报告跟踪了 200 家主要科技公司在 2020 年至 2023 年期间的温室气体排放情况,结果显示 2023 年亚马逊、微软、Alphabet 和 Meta 的间接碳排放平均是 2020 年水平的 150%,其中亚马逊增幅最高,2023 年为 2020 年水平的 182%,微软是 155%,Meta 145%,Alphabet 为 138%。报告称,AI 的快速发展正推动全球电力需求的急剧增长,数据中心用电量的增速是整体用电量增速的四倍。随着对 AI 投资的加速,AI 系统每年的碳排放量预计将达到 1.026 亿吨二氧化碳当量。