AI 每周热闻:创新、洞察与行业趋势(2024年9月29日 - 10月5日)
7 个月前
欢迎来到十月!再次欢迎您阅读我们每周更新的最新一期。和往常一样,我们将为您带来AI生态系统中的所有热点、最新动态和新闻。本月带来了许多令人兴奋的新产品发布和更新。请继续关注以下详细信息。
发展/发布/更新
- OpenAI推出“Canvas”:一个改变游戏规则的工作空间,让与ChatGPT的写作和编码更加无缝
OpenAI推出了一项与ChatGPT互动的新功能,称为“canvas”,为用户提供了一个更动态和实用的写作和编码工作空间。canvas在标准聊天界面旁边创建了一个独立窗口,用户可以在其中生成内容——无论是文本还是代码——并直接与之互动。这包括突出显示工作部分以进行编辑,使与AI的协作更加顺畅和直观。最初在ChatGPT Plus和Teams用户中进行测试,随后也将很快向企业和教育用户开放。
OpenAI的这一举措反映了消费者AI提供商日益关注创建可编辑工作空间的趋势,以增强用户与生成性AI的互动。类似的功能已经出现在像Anthropic的“Artifacts”这样的产品中,该产品于6月推出,以及病毒式流行的编码助手“Cursor”。竞争非常激烈,OpenAI正在加速提升ChatGPT的能力,并推出像canvas这样的新工具,以吸引更多付费用户。
目前AI聊天机器人面临的一个限制是,它们无法从单一提示处理大型项目。然而,它们在提供坚实的起点方面表现出色,之后可以进行细化。canvas工作空间允许用户调整AI生成输出的特定部分——无论是修正代码中的错误还是调整电子邮件的语气——而无需从头开始重新生成整个部分。它节省了时间,让用户可以专注于细节的完善,而不是重新开始。
这些更新旨在使ChatGPT更加用户友好和协作,特别是在写作或编码等复杂任务中,AI可以作为一个有用的合作伙伴,而不仅仅是生成文本的工具。通过创建一个更互动和灵活的工作空间,OpenAI正在将ChatGPT定位为一个更通用的解决方案,以跟上竞争对手的步伐,同时扩展其付费用户的功能。
阅读更多 这里
2. Meta推出Movie Gen:一个改变游戏规则的AI工具,轻松创建视频
Meta Platforms Inc.最近推出了Movie Gen,这是一款尖端的AI工具,使用户能够根据简单的文本提示生成或编辑视频。这一发展标志着AI技术竞争格局的重大进展,使Meta与OpenAI的Sora和谷歌的Veo等主要参与者直接竞争。
Movie Gen允许根据用户提示生成最长16秒的视频。除了创建新视频外,它还可以为这些剪辑生成音频或编辑现有视频。用户甚至可以上传照片,以创建包含真实人物的定制视频。
目前,Movie Gen仅对一小部分内部员工和外部合作伙伴(包括电影制作人)开放。Meta计划在明年将该工具整合到其现有平台中,如Instagram和Facebook。
阅读更多 这里
3. 谷歌的Gmail问答:为您的收件箱提供新的AI助手
本周,谷歌宣布,部分iOS上的Gmail用户现在可以通过名为Gmail问答的新功能与其Gemini聊天机器人进行对话,该功能在8月已向Android用户推出。
Gmail问答适用于Google One AI Premium订阅者和具有Gemini Business、Enterprise、Education或Education Premium附加功能的Google Workspace账户,旨在改变用户与收件箱的互动方式。用户可以向Gemini提出特定问题,例如:“公司在上次营销活动上花了多少钱?”或请求关于季度规划的电子邮件摘要。
最初,该功能仅会从您的收件箱中提取信息,但谷歌计划在未来扩展其功能,包括Google Drive。传统的搜索栏将继续保留,但将添加一个Gemini按钮,以鼓励用户利用AI查找特定信息。
看起来免费Gmail用户不太可能很快获得此功能,因为谷歌正在推广它以吸引用户订阅其服务。这一策略与科技公司将AI功能整合到现有产品(如Google Docs和日历)的更广泛趋势相一致。
有趣的是,此次推出是在Gmail引入重新设计的“摘要卡片”之后,旨在帮助用户通过跟踪包裹、办理航班、设置提醒等方式来组织收件箱。
通过这些更新增强其电子邮件服务,谷歌确保其产品保持竞争力,尤其是在苹果在iOS 18的邮件应用中引入类似功能的情况下。
阅读更多 这里
4. Voyage AI通过尖端检索技术应对AI幻觉,获得2000万美元扩展资金
AI往往会“编造事实”——这一问题让许多用户感到沮丧,尤其是对于那些不准确的结果可能带来实际后果的企业而言。事实上,最近的一项Salesforce调查发现,半数员工担心公司AI系统提供不准确的答案。
虽然没有魔法解决方案可以完全阻止这些“幻觉”,但一些技术可以有所帮助。一种名为检索增强生成(RAG)的方法,将AI与知识库结合,以在模型响应之前提供额外信息,充当内置的事实检查器。
这就是像Voyage AI这样的公司的用武之地。Voyage于2023年由斯坦福教授Tengyu Ma创立,为Harvey、Vanta、Replit和SK Telecom等公司构建RAG系统。他们专注于为特定行业(如编码、金融和法律)定制这些系统。
Voyage的AI模型将各种类型的数据——文本、文档、PDF——转换为称为向量嵌入的紧凑表示。这些嵌入捕捉数据中的含义和关系,使其非常适合与RAG相关的搜索任务。
Voyage使用一种称为“上下文嵌入”的嵌入类型,它不仅理解单词的含义,还考虑上下文。例如,如果您在两个不同的句子中使用“银行”这个词——一个关于河流,另一个关于财务——Voyage的模型将为每个句子生成不同的含义。
Voyage提供其模型供本地或私有和公共云使用,并为客户进行微调。虽然其他公司(如OpenAI)也提供嵌入服务,但Voyage声称他们在性能和成本方面提供更好的表现。
在典型的RAG系统中,当被问及问题时,AI首先从知识库中检索相关信息——就像图书管理员找到正确的书一样。挑战在于,许多系统在编码信息时会失去上下文,从而导致错误。然而,Voyage的模型旨在保持上下文并实现更高的准确性,从而产生更好的整体响应。甚至连OpenAI的主要竞争对手之一Anthropic也将Voyage的模型描述为“最先进的”。
阅读更多 这里
5. AI驱动的工具“Captions”重新定义社交媒体管理
Captions是一款AI驱动的视频编辑应用,正在推出一项改变游戏规则的工具,自动化视频的内容发布计划,甚至根据相关主题生成视频。这可能对希望增强在线存在感的企业大有裨益,但也引发了关于社交媒体管理工作未来的重要问题。
该新工具扫描网站以提取信息——收集内容、关键词、服务提供和关键卖点——以创建量身定制的内容计划。目前,重点主要放在Instagram Reels和TikTok等社交媒体平台上,Captions在视频创建和编辑方面表现出色。
想象一下,一家小咖啡馆想展示其厨师,或一家牙科诊所希望解释其服务——该工具可以生成针对其特定需求和季节趋势的引人入胜的视频。
当Captions的首席执行官Gaurav Misra被问及关于AI生成视频可能削弱创作者追求的真实性的担忧时,他强调该工具旨在帮助那些可能缺乏资源以制作优质内容的人。
“对于许多企业来说,走红并不是目标,”Misra解释道。“他们只是希望建立在线存在感,并清晰地传达他们的信息。这就是我们的用武之地。”但随着企业越来越依赖AI满足其内容需求,传统上担任这一角色的社交媒体经理会发生什么呢?
Misra还指出,企业主需要处理众多责任,借助这个新的AI社交媒体经理,他们无需从头学习视频录制和编辑。
探索 这里
新闻
- 灯光、摄像、AI:Lionsgate与Runway的改变游戏规则的合作
尽管关于人工智能在好莱坞的讨论似乎已经是旧闻,但Lionsgate与Runway的激动人心的合作正准备在电影行业掀起波澜。随着AI在2023年编剧和演员罢工期间成为热门话题,我们现在看到它在电影制作中的实际应用。
Lionsgate正在大胆迈出一步,与以创新AI技术而闻名的Runway公司合作。他们的目标是将AI贯穿整个电影制作过程——这是其他任何制片厂尚未做到的。虽然许多制片厂在特定阶段尝试使用AI,但Lionsgate希望从前期制作到后期制作无缝整合AI。这可能会改变游戏规则。
AI将如何使用?
前期制作:
- 剧本增强:想象一下,AI帮助完善和润色剧本,使其更强大、更吸引人。
- 视觉头脑风暴:电影制作人将能够实时看到他们的想法变为现实,并随时进行调整。
制作:
- 创意探索:借助Runway的技术,创作者可以使用简单的文本提示实验不同的视觉风格和效果。
- 逼真的场景设计:AI将帮助设计沉浸式环境,让观众更深入故事。
后期制作:
- 简化编辑:AI工具将使色彩校正和编辑更快、更高效,让编辑人员专注于讲述故事。
- 轻松协作:导演、编辑和特效团队可以实时协作,增强创意。
这种全面的方法不仅承诺加快制作时间表,还将创造出更具视觉冲击力和吸引力的电影。
阅读更多 这里
- 高科技监控:旧金山推出移动摄像头打击犯罪
图片来源:移动监控单元(LVT)(Kurt "CyberGuy" Knutsson)
旧金山在打击犯罪方面采取了大胆措施,部署了三台新的移动监控摄像头。这一举措是利用先进技术进行执法和改善城市公共安全的更大战略的一部分。随着城市地区犯罪率上升,旧金山希望在创新犯罪预防策略方面成为领导者。
市官员相信,这些移动监控单元将威慑犯罪活动,并为调查提供重要证据。实施这一技术的决定反映了利用所有可用资源保护居民和游客的承诺。通过采用高科技解决方案,旧金山希望在持续的犯罪担忧中创造更安全的社区。
这些移动单元由LiveView Technologies制造,配备了先进的功能,包括三台摄像头、22英尺高的杆、泛光灯、闪光灯和发出警告的扬声器。凭借AI能力,这些摄像头提供热成像、光学和全景视图,以及32倍变焦进行实时监控。这种主动的方法旨在在犯罪发生之前进行预防。
阅读更多 这里
这就是我们本周的全部内容,和往常一样,我们希望您觉得这篇文章内容丰富。请继续关注下周的更新。再见!
推荐阅读:
FluxAI 中文
© 2025. All Rights Reserved