一文看AI最新进展!民工使用指南
日期:2023-10-17 13:48:42 / 人气:215
2023年3月,以GPT-4为代表的AI技术掀起了一波AI热。半年过去了,AI领域有了很多新的发展,有些可能会彻底改变农民工的生活。
下面,我们就来盘点一下这半年来AI领域最值得你关注的事情。
GPT最大的竞争对手双子座出现了。
2023年5月,在谷歌I/O开发者大会上,谷歌CEO皮查伊透露,谷歌的深层思维正在训练双子座模型。
Gemini是一个大型语言模型,专门用于测试GPT-4。根据半分析的分析,双子星的计算能力将达到GPT-4的五倍。
此外,与GPT-4相比,Genimi可以更好地支持多模态输入,这意味着除了文本信息,双子座还可以处理图片和语音信息,这可能使双子座比现在的GPT-4更方便使用。
而且我们可能很快就能见证双子座的表现了。据海外科技媒体The Information 9月14日报道,双子星已经向部分公司开放了使用和测试的权限。也许用不了多久,Gemini就会被部署到谷歌的产品矩阵中,开始服务大众。
来源:网络
开放式人工智能培训
更通用的“GPT-5”
当然,面对双子星这样拥有多模态能力的对手,OpenAI也不会坐以待毙。
事实上,早在今年3月的GPT-4会议上,GPT-4就展示了其多模态处理能力。在当时的发布会上,主讲人手绘了一个网页的草图,拍了照片发给GPT 4号,告诉它按照这个布局做一个网页,GPT 4号马上就写出了网页代码。
但在发布会后的实际应用中,用户似乎并没有体验到ChatGPT的多模态处理能力。
为了迎接谷歌双子星座的挑战,OpenAI将ChatGPT与Dall e-3(一种新的图像生成模型)相结合,使GPT更加通用。9月25日,GPT-4版本更新后,也可以处理语音和图片信息。
比如下面是Dall e-3和ChatGPT生成的内容。GPT不仅能根据文字画出相应的图片,还能解释图片上的信息,并根据对话对图片进行一些修改。
根据文本创建的图片
GPT解释了为什么图片中的刺猬这么好。
根据要求,“秀刺猬很热情”,DALL E 3生成的图片。
除了将Dall e-3与ChatGPT结合,OpenAI还开始部署“GPT-5”。在9月25日发布的新版GPT中,已经引入了语音通信和图像识别的测试功能。
事实上,今年3月(也就是GPT-4出现后不久),网上就出现了一波要求暂停GPT-5研究的浪潮,原因是担心信息安全和隐私问题。作为OpenAI的首席执行官,山姆·奥特曼也承诺短期内不会训练GPT-5模型。
资料显示,GPT-4出现半年后,OpenAI已经开始研发代号为“戈壁”的新型号,在设计之初就具备多模态能力。甚至有些媒体声称它可能是未来的GPT-5。
微软发布“农民工福利套餐”
微软Copilot
9月21日,微软发布微软Copilot family bucket。如果你对微软Copilot不熟悉,可以理解为我们常用的Word、Excel、PPT等软件以及Windows自带的浏览器都会受到GPT-4的加持。
以我们最常用的词为例。写稿子的时候,可以直接告诉Word一个主题,让它自动生成与这个主题相关的稿子。同时它还具有图片匹配的功能,你甚至不需要花时间在网上找图片,只需要让它根据文字生成图片。
还有Excel。在新的微软Copilot family bucket中,不需要记忆各种公式,也不需要用Excel编程。你只需要告诉Excel你的用途,它就会自动为你完成编写公式、代码、分析数据的工作。你只需要等着看结果。
此外,在浏览网页时,你甚至不必详细阅读网页的内容。浏览器可以直接帮你汇总当前页面的重要信息,节省你很多时间。
这可能是半年来对打人工人最“友好”的AI礼包了。
人工智能帮助人类理解气味。
在人类的视觉、听觉和嗅觉中,嗅觉可能比我们想象的要复杂得多。
对于视觉来说,我们看到的颜色可以和光的波长联系起来。对于听觉来说,声音与物体的振动频率有关。关于嗅觉,人类不仅有数百种嗅觉感受器,而且生活中常见的气味往往是由多种气味分子组成的,很难建立简单完善的数学模型。
今年8月发表在《科学》杂志上的一篇论文指出,科学家通过“图形神经网络”的AI技术识别了气味与成分之间的关系,并生成了气味图谱。根据这个图谱,我们可以用已知的化合物来配置想要的味道。
更重要的是,AI绘制的气味地图覆盖了50万种潜在的气味,这意味着在AI的帮助下,我们可能能够闻到我们以前从未想象过的气味。这可能会大大改变食品和香料行业的现状,让我们的生活更“有味道”。
人工智能气味识别的过程,图片来源:参考资料。
自动驾驶亲自告诉你。
你怎么开车?
9月14日,自动驾驶公司Wayve发布了开环自动驾驶评论员LINGO-1。我们可以简单理解为自动驾驶解释器。
自动驾驶为什么需要翻译?事实上,这是一项非常有趣和重要的研究。想象一下,当你在开车的时候,你所做的每一个选择和动作都必须有一定的依据。比如你觉得前面的车太慢了,旁边的车道空着很安全,所以你决定开到旁边的车道超车,或者你在路口减速,因为这里人多,所以你需要仔细观察周围的环境。
LINGO-1还可以用熟悉的自然语言解释自动驾驶汽车的每一步,还可以回应特定的人类问题。比如自动驾驶汽车停在路口的时候,你可以问它“你现在在观察什么?”;如果你身边有人在骑自行车,你也可以问自动驾驶汽车“你怎么判断你和这个骑自行车的人保持了安全距离?”
目前LINGO-1的回答准确率只有60%左右,但是LINGO-1的能力还在提高,这种研究意义重大。
可以提高人工智能的可解释性。在过去,自动驾驶汽车的很多决策对于人类来说都是一个黑匣子。我们不知道车为什么变道,也不知道在前面可以超车的情况下为什么选择不超车。在了解了AI如何决策之后,工程师也可以更好地设计自动驾驶算法,不断提高自动驾驶汽车的安全性。同时也能增加普通用户对自动驾驶的理解和信任,让人工智能的决策过程不再是黑箱。
AI在很多比赛中都超过了人类。
8月30日,发表在《自然》杂志上的一篇文章显示,在无人机竞速的第一人称视角下,AI已经超越了人类。
第一人称视角的无人机竞速和普通遥控飞机不同。飞行员需要从高速飞行的无人机角度观察环境,并对其进行操纵。对于AI来说,AI需要快速分析视频传感器返回的信息,做出优化飞行路径的决策。《自然》杂志的文章称,能够在这场比赛中击败人类冠军,是“移动机器人和机器智能领域的里程碑”。这一成果可能对未来的自动驾驶汽车和无人飞行器具有重要价值。
除了无人机领域,AI在验证码领域也有惊人表现。
验证码在生活中很常见。当你想进入一个账号,登录一个网页的时候,经常会看到各种各样的验证码,包括识别奇形怪状的字母和数字,拖动一个类似拼图游戏的滑块,或者抬头点击一个图片。这些验证码的目的是防止机器人恶意登录注册。
但2023年7月的一篇文章显示,AI可能比人类更擅长处理验证码。该实验邀请了1000多名人类测试人员使用120个主流网站上的验证码。
结果表明,人类解决验证码问题的准确率为50% ~ 80%。相比之下,AI求解验证码的准确率在85% ~ 100%,大部分在96%以上。除了准确率比人类高,AI解验证码的时间也比人类快0.5秒。
这意味着,随着AI技术的发展,人类用来防范AI的验证码的作用可能会越来越小,这对网络和信息安全是非常严峻的挑战。科学家需要开始设计新的验证码,可以在不困惑人类的情况下防止AI。
人脑模拟计划“失败”
虽然近年来人工智能技术突飞猛进,但人类在用AI模拟人脑方面还是遭遇了“滑铁卢”。
2013年,欧洲科学家启动了一项为期10年的“人脑计划”。科学家打算用10年时间,利用顶尖的计算机技术,模拟人脑中的数百亿个神经元及其突触,从而还原人脑的运行过程,揭开人脑的神秘面纱。
今年10月1日是这一项目的“兑现”时间,但科学家们已累计投入13亿欧元(约合100亿人民币),但距离“模拟人脑”的目标仍有很大距离。科学家们远远低估了人脑的复杂性。可以说,这是人类试图构建“人工智能”的一次失败。
虽然人类在人脑项目中还没有成功建立一个“人工智能”,但这样的探索是很有意义的。在这个项目中,科学家们真正对人脑有了更深入的了解。例如,科学家绘制了更详细的人脑地图,并在前额叶皮层发现了几个以前未知的大脑区域。
此外,科学家建立了基因表达与大脑结构的关系,科学家可以从基因层面研究一些与大脑结构相关的疾病(如抑郁症)。一些数字大脑模型也已经在临床上用于帕金森病等疾病。
来源:摄影师:许摄
除了欧洲脑计划,中国、美国、日本、韩国、澳大利亚等国家也有自己的脑计划。只有对人脑的结构和智能的起源有了更深入的了解,才能更好地发展“人工智能”技术。
人工智能的发展极其迅速。在过去的半年里,GPT-4遇到了一个强大的对手,AI帮助人类构建了气味地图和更详细的大脑地图,自动驾驶汽车也有了“解释器”。
正是这种快速的技术发展使我们能够享受更安全和更方便的生活。他们的发展是生活中每天上演的科幻大片。
下面,我们就来盘点一下这半年来AI领域最值得你关注的事情。
GPT最大的竞争对手双子座出现了。
2023年5月,在谷歌I/O开发者大会上,谷歌CEO皮查伊透露,谷歌的深层思维正在训练双子座模型。
Gemini是一个大型语言模型,专门用于测试GPT-4。根据半分析的分析,双子星的计算能力将达到GPT-4的五倍。
此外,与GPT-4相比,Genimi可以更好地支持多模态输入,这意味着除了文本信息,双子座还可以处理图片和语音信息,这可能使双子座比现在的GPT-4更方便使用。
而且我们可能很快就能见证双子座的表现了。据海外科技媒体The Information 9月14日报道,双子星已经向部分公司开放了使用和测试的权限。也许用不了多久,Gemini就会被部署到谷歌的产品矩阵中,开始服务大众。
来源:网络
开放式人工智能培训
更通用的“GPT-5”
当然,面对双子星这样拥有多模态能力的对手,OpenAI也不会坐以待毙。
事实上,早在今年3月的GPT-4会议上,GPT-4就展示了其多模态处理能力。在当时的发布会上,主讲人手绘了一个网页的草图,拍了照片发给GPT 4号,告诉它按照这个布局做一个网页,GPT 4号马上就写出了网页代码。
但在发布会后的实际应用中,用户似乎并没有体验到ChatGPT的多模态处理能力。
为了迎接谷歌双子星座的挑战,OpenAI将ChatGPT与Dall e-3(一种新的图像生成模型)相结合,使GPT更加通用。9月25日,GPT-4版本更新后,也可以处理语音和图片信息。
比如下面是Dall e-3和ChatGPT生成的内容。GPT不仅能根据文字画出相应的图片,还能解释图片上的信息,并根据对话对图片进行一些修改。
根据文本创建的图片
GPT解释了为什么图片中的刺猬这么好。
根据要求,“秀刺猬很热情”,DALL E 3生成的图片。
除了将Dall e-3与ChatGPT结合,OpenAI还开始部署“GPT-5”。在9月25日发布的新版GPT中,已经引入了语音通信和图像识别的测试功能。
事实上,今年3月(也就是GPT-4出现后不久),网上就出现了一波要求暂停GPT-5研究的浪潮,原因是担心信息安全和隐私问题。作为OpenAI的首席执行官,山姆·奥特曼也承诺短期内不会训练GPT-5模型。
资料显示,GPT-4出现半年后,OpenAI已经开始研发代号为“戈壁”的新型号,在设计之初就具备多模态能力。甚至有些媒体声称它可能是未来的GPT-5。
微软发布“农民工福利套餐”
微软Copilot
9月21日,微软发布微软Copilot family bucket。如果你对微软Copilot不熟悉,可以理解为我们常用的Word、Excel、PPT等软件以及Windows自带的浏览器都会受到GPT-4的加持。
以我们最常用的词为例。写稿子的时候,可以直接告诉Word一个主题,让它自动生成与这个主题相关的稿子。同时它还具有图片匹配的功能,你甚至不需要花时间在网上找图片,只需要让它根据文字生成图片。
还有Excel。在新的微软Copilot family bucket中,不需要记忆各种公式,也不需要用Excel编程。你只需要告诉Excel你的用途,它就会自动为你完成编写公式、代码、分析数据的工作。你只需要等着看结果。
此外,在浏览网页时,你甚至不必详细阅读网页的内容。浏览器可以直接帮你汇总当前页面的重要信息,节省你很多时间。
这可能是半年来对打人工人最“友好”的AI礼包了。
人工智能帮助人类理解气味。
在人类的视觉、听觉和嗅觉中,嗅觉可能比我们想象的要复杂得多。
对于视觉来说,我们看到的颜色可以和光的波长联系起来。对于听觉来说,声音与物体的振动频率有关。关于嗅觉,人类不仅有数百种嗅觉感受器,而且生活中常见的气味往往是由多种气味分子组成的,很难建立简单完善的数学模型。
今年8月发表在《科学》杂志上的一篇论文指出,科学家通过“图形神经网络”的AI技术识别了气味与成分之间的关系,并生成了气味图谱。根据这个图谱,我们可以用已知的化合物来配置想要的味道。
更重要的是,AI绘制的气味地图覆盖了50万种潜在的气味,这意味着在AI的帮助下,我们可能能够闻到我们以前从未想象过的气味。这可能会大大改变食品和香料行业的现状,让我们的生活更“有味道”。
人工智能气味识别的过程,图片来源:参考资料。
自动驾驶亲自告诉你。
你怎么开车?
9月14日,自动驾驶公司Wayve发布了开环自动驾驶评论员LINGO-1。我们可以简单理解为自动驾驶解释器。
自动驾驶为什么需要翻译?事实上,这是一项非常有趣和重要的研究。想象一下,当你在开车的时候,你所做的每一个选择和动作都必须有一定的依据。比如你觉得前面的车太慢了,旁边的车道空着很安全,所以你决定开到旁边的车道超车,或者你在路口减速,因为这里人多,所以你需要仔细观察周围的环境。
LINGO-1还可以用熟悉的自然语言解释自动驾驶汽车的每一步,还可以回应特定的人类问题。比如自动驾驶汽车停在路口的时候,你可以问它“你现在在观察什么?”;如果你身边有人在骑自行车,你也可以问自动驾驶汽车“你怎么判断你和这个骑自行车的人保持了安全距离?”
目前LINGO-1的回答准确率只有60%左右,但是LINGO-1的能力还在提高,这种研究意义重大。
可以提高人工智能的可解释性。在过去,自动驾驶汽车的很多决策对于人类来说都是一个黑匣子。我们不知道车为什么变道,也不知道在前面可以超车的情况下为什么选择不超车。在了解了AI如何决策之后,工程师也可以更好地设计自动驾驶算法,不断提高自动驾驶汽车的安全性。同时也能增加普通用户对自动驾驶的理解和信任,让人工智能的决策过程不再是黑箱。
AI在很多比赛中都超过了人类。
8月30日,发表在《自然》杂志上的一篇文章显示,在无人机竞速的第一人称视角下,AI已经超越了人类。
第一人称视角的无人机竞速和普通遥控飞机不同。飞行员需要从高速飞行的无人机角度观察环境,并对其进行操纵。对于AI来说,AI需要快速分析视频传感器返回的信息,做出优化飞行路径的决策。《自然》杂志的文章称,能够在这场比赛中击败人类冠军,是“移动机器人和机器智能领域的里程碑”。这一成果可能对未来的自动驾驶汽车和无人飞行器具有重要价值。
除了无人机领域,AI在验证码领域也有惊人表现。
验证码在生活中很常见。当你想进入一个账号,登录一个网页的时候,经常会看到各种各样的验证码,包括识别奇形怪状的字母和数字,拖动一个类似拼图游戏的滑块,或者抬头点击一个图片。这些验证码的目的是防止机器人恶意登录注册。
但2023年7月的一篇文章显示,AI可能比人类更擅长处理验证码。该实验邀请了1000多名人类测试人员使用120个主流网站上的验证码。
结果表明,人类解决验证码问题的准确率为50% ~ 80%。相比之下,AI求解验证码的准确率在85% ~ 100%,大部分在96%以上。除了准确率比人类高,AI解验证码的时间也比人类快0.5秒。
这意味着,随着AI技术的发展,人类用来防范AI的验证码的作用可能会越来越小,这对网络和信息安全是非常严峻的挑战。科学家需要开始设计新的验证码,可以在不困惑人类的情况下防止AI。
人脑模拟计划“失败”
虽然近年来人工智能技术突飞猛进,但人类在用AI模拟人脑方面还是遭遇了“滑铁卢”。
2013年,欧洲科学家启动了一项为期10年的“人脑计划”。科学家打算用10年时间,利用顶尖的计算机技术,模拟人脑中的数百亿个神经元及其突触,从而还原人脑的运行过程,揭开人脑的神秘面纱。
今年10月1日是这一项目的“兑现”时间,但科学家们已累计投入13亿欧元(约合100亿人民币),但距离“模拟人脑”的目标仍有很大距离。科学家们远远低估了人脑的复杂性。可以说,这是人类试图构建“人工智能”的一次失败。
虽然人类在人脑项目中还没有成功建立一个“人工智能”,但这样的探索是很有意义的。在这个项目中,科学家们真正对人脑有了更深入的了解。例如,科学家绘制了更详细的人脑地图,并在前额叶皮层发现了几个以前未知的大脑区域。
此外,科学家建立了基因表达与大脑结构的关系,科学家可以从基因层面研究一些与大脑结构相关的疾病(如抑郁症)。一些数字大脑模型也已经在临床上用于帕金森病等疾病。
来源:摄影师:许摄
除了欧洲脑计划,中国、美国、日本、韩国、澳大利亚等国家也有自己的脑计划。只有对人脑的结构和智能的起源有了更深入的了解,才能更好地发展“人工智能”技术。
人工智能的发展极其迅速。在过去的半年里,GPT-4遇到了一个强大的对手,AI帮助人类构建了气味地图和更详细的大脑地图,自动驾驶汽车也有了“解释器”。
正是这种快速的技术发展使我们能够享受更安全和更方便的生活。他们的发展是生活中每天上演的科幻大片。
作者:高德娱乐
新闻资讯 News
- 热狗新歌争议:周杰伦躺枪?事实是...12-04
- 高圆圆和女朋友有28年的交情,和...12-04
- 魏大勋现身鸟镇秦岚,感情又起波...12-04
- “黄婉佩和她富有的丈夫庆祝他们...12-04