开发喵星球

有本科生水平的Claude3? Claude测评来啦

有本科生水平的Claude3? Claude测评来啦

根据Anthropic公司的官方信息,他们最新推出的人工智能系统Claude 3由三个不同版本的模型组成,分别命名为Opus、Sonnet和Haiku。虽然具体的模型参数未对外公开,但官方对这三个版本在性能表现和适用场景方面做了清晰的区分说明:

Opus和Sonnet两个版本目前已经可以使用,开发者可在官网上免费体验经济实惠的Sonnet版本,而想使用Opus则需付费。至于Haiku版本,它将在未来几周内面世。

文章总结

针对OpenAI前科学家Karpathy最新推出的”构建分词器”教程视频,尽管时长高达2个多小时,但Claude 3系统只通过一轮提示就能将其内容精华提炼成博客文章的形式。该文章不仅包含了详尽的文字说明,还辅以插图和代码示例,对视频内容进行了完整呈现,而非简单罗列视频中的每一句原话。值得一提的是,Claude 3系统在总结时所依赖的输入并非视频本身,而是视频的文字字幕文件,其中每5秒就附带一次的视频截图辅助。

img

代码能力

让它用代码实现苹果官网的一块UI,看看怎么样

IMG_7562

效果还不错,优化的也还可以。

识图功能

给它一个时钟图片识别图片上的时间,本来是9:27

image-20240312152333593

这个结果不是让我很满意

对于这个图片内容的识别就比较好

image-20240312152745945

逻辑思维能力

截屏2024-03-12 15.30.54

让它做这道题试试

image-20240312153209445

回答非常完美

有一个有意思的测试,前后两天的回答截然不同,让我觉得很神奇。感叹Claude的学习能力和速度

img

这样的一张图,昨天我问它的时候他是这么回答的

image-20240312153700399

而今天我问的时候变成了这样

E5nhRkm6BSorF79

尽管在测试中,目前的版本还不算稳定,时常崩溃,有一些功能偶尔也抽风,并不能如期发挥,但总体来看,网友还是相当看好Claude,评测完毫不犹豫地表示:Claude 3相比之前的版本,真的“来势汹汹”,会员可充,值得充。而随着新系列模型的进一步优化和应用,我们或许将看到更加多元化的大模型生态。

   
分类:玩技术 作者:荡荡, 浩浩 发表于:2024-03-12 16:01:06 阅读量:83
<<   >>


powered by kaifamiao