Meta号称替代程序员的LlamaCoder效果被CodeFlying秒杀,来看实测!

在讲LlamaCoder之前咱先浅聊一下Meta

这两天Meta凭借着Connect 2024大会可谓是风头正盛,刚刚发布的全新开源多模态大模型Llama3.2,热度是一路赶超咱的小草莓啊。

作为一款开源大模型能够和闭源的4o-mini、Claude3 Haiku打的有来有回,

甚至Llama 3.2中杯(90B)在图像任务的理解和处理上已经把Claude3 Haiku击败了。

好了点到为止,咱知道Meta在开源大模型这块子的实力就行,现在大家肯定会好奇了,

Meta这么牛,LlamaCoder虽然是基于Llama3.1开发的AI编码助手,但肯定实力也不差吧?

为啥标题要这么说?(我绝对不是标题党~)

实力确实不差,但是国内的CodeFlying码上飞(后简称CodeFlying)实力比他还豪横,

并非空口无凭,先来瞅个视频,然后请各位看官再细品下文~

后面会用图文的形式详细介绍CodeFlying开发应用的全过程,

有心急的小伙伴也可以点目录二、CodeFlying直接去看哦~

一、LlamaCoder

LlamaCoder是基于Llama 3.1的超大杯(405B)开发的开源AI编码工具,主要有以下几个能力:

  1. 代码生成:LlamaCoder能够根据用户的自然语言提示自动生成代码,支持Python、JavaScript等多种编程语言。

  2. 应用创建:用户可以根据自己的需求快速创建全栈应用程序,就是直接生成出来一个应用。

  3. 组件集成:LlamaCoder集成了Sandpack用于代码沙盒、Next.js用于应用路由、Tailwind用于样式设计,以及Helicone用于可观测性和分析。

  4. 数据驱动:支持数据分析和处理,帮助开发者更好地理解和优化应用程序 

其中最核心的能力就是可以通过描述来使AI生成一个应用程序,边写代码边预览应用的实际效果。

和Claude Artifacts差不多,但其实实测下来效果并不如Artifacts

链接附上:Llama Coder – AI Code Generator (together.ai)
感兴趣的小伙伴可以去体验一下。

进入到网站能看到在开发首页上就有一个醒目的提示词告诉大家,能够将想法变成应用程序(看起来好牛),

那接下来,咱就来实测一下LlamaCoder的真实能力,是不是他宣传的那样神乎。

先从最简单的功能测起,让他帮我开发一个可以add和delete的list清单

呃,效果似乎一言难尽,基本的样式是有了,操作也有了就是这个逻辑吧似乎有点问题,

我remove一个任务之后,会自动新建一个任务,且remove按钮的校准也有问题。

而且是英文的,看着比较变扭,不过也有可能是我提问的原因。

那我在试着完善一下,毕竟不能一步到位嘛(划重点,后面要考)

这样看着好像顺眼多了,但是功能还是有点问题。那就先不管了,我们换别的任务让他开发一下看看。

直接告诉他帮我开发一个小游戏,看着好像是搞了个贪吃蛇出来,

试一下能不能用,不过结果好像有点尴尬,这玩意儿好像就是个button的样式,完全不能运行。

于是我又继续提问,让他生成的这个应用能够供我在线体验。

结果给我生成了一个XO的小游戏,体验了一下,能玩倒是能玩,哪方赢了还会有结果显示出来,就是当遇到平局的时候他就没法处理了。

小功能都试过了,再试试能不能开发出来一个复杂一点的程序。

我告诉他我想开发一个缺陷管理系统,能够记录缺陷的信息,设置缺陷的发现人,处理人以及缺陷的处理时间和优先级。

生成出来了,来体验一下看看效果(这次不用提醒他用中文,给个好评) 

效果还是不错的,生成出来了一个可编辑的表单,并且添加的缺陷会记录到列表里,

在时间的选择上也是直接生成出了一个时间选择器。

接下来试一下,继续让AI完善这个应用,

还是有说法的,我们要的功能基本都实现了,但是他自己给我配置了几个人名,少了一个delete的功能。

继续来试一波难度高一点的需求,将刚才的几个功能点结合起来,再加上几个新的想法,看看能不能一口气直接跑出来。

先把需求列出来:

我想开发一个缺陷管理系统,它能够记录缺陷的信息,设置缺陷的发现人,处理人以及缺陷的处理时间和优先级,同时具备上传附件图片的功能。可以由我自己配置发现人和处理人的信息,要具备删除缺陷的功能,以及删除人员信息的功能。同时每个缺陷可以关联一个项目,一个项目下可以有多个缺陷,点击项目的详情能查看这个项目下所有的缺陷信息。

这次我直接把整个开发的过程都录了下来,我们能在沙盒里看到他确实在猛猛的写代码,从代码里面也能看到我们提到的一些功能。但是最后还是没能把这个应用跑出来。

二、CodeFlying

那接下来,我们就直接试一下CodeFlying的效果吧,

对于CodeFlying我就用一句话简单的介绍一下,因为相信大家看完之后,一定会自己去了解CodeFlying到底是何方神圣了。

CodeFlying,是国内首发的文生软件平台,一句话就能生成一个完整的应用程序。

我直接把刚才发给LlamaCoder的需求甩给了CodeFlying的AI,他明确的识别出了我想要做的应用,并给出了一个叫做“缺陷管理系统”的解决方案

从这两段对话中可以看出AI把需要开发的页面和功能都罗列了出来,并且向我发出了确认需求的提示。

然后AI就直接开始设计这个应用程序了,并且有3个agent直接参与了应用在需求阐述、研发以及测试验收环节的工作。

点开下拉能看到agent给出的具体设计方案,这里就不展示出来了,后面会有一个视频供大家预览。

直接点击确定设计,开发应用。

应用开发完了之后,还直接给咱部署了出来,来体验一下看看。

(跟开头的视频是一个哦~)

不得不说确实牛啊,如此复杂的需求,直接一步到位了,功能都完美实现了不说,甚至在ui上还有自己的设计。

更重要的是,竟然直接开发出了前端和后端,我滴个乖乖

在两端之间切换的非常丝滑,并且使用起来一点延迟都没有。

甚至连登录系统都给我做出来了(我都没提...)

直接就是一个AI干了一个项目组的活呀这是。

更牛的是看这个

开发完应用之后,还可以下载这个应用的前后端代码,并且前面几个agent生成的设计文档都可以直接拿走。 

压缩包里包含了应用源代码,产品需求文档,架构设计文档,产品测试用例以及部署运维文档(连部署和运维都考虑到了这是我没想到的)。

总而言之就是一个字 震撼!

老实说,在写这篇文章的时候我已经开始期待用CodeFlying开发出各种各样的应用了。

三、总结

再来总结一下这次测评

LlamaCoder的效果整体来说也还不错,几个小的功能点测试都达到了预期的水平,

但是在生成一个具有多个复杂功能的应用上就有点捉襟见肘了,

并且它的代码只能生成245行,另外就是目前也只能生成react项目。

和他的竞品Claude Artifacts比起来还有点小差距,当然也有可能是因为模型的原因,毕竟 Artifacts用的是自家的闭源中杯模型嘛。

而CodeFlying的表现想必不用我多说了吧,整个开发过程,体验的流畅度都摆在这里,

相信大家对CodeFlying能力的期待值也拉满了,那这里我就放上链接供大家去体验一下咯。

码上飞 CodeFlying | AI 智能软件开发平台!

创作不易~大家点点关注呀!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1548590.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

32. Java栈和队列

1. 前言 栈和队列相关的题目是校招中出现频率一般,但是是属于相对基础的题型。我们要关注两类问题,栈和队列的添加和删除操作,以及栈和队列之间的区别和联系。 2. 栈和队列 2.1 数据结构 首先我们给出栈和队列的数据结构定义: (1)栈(Stack):允许在某一端插入元素(…

Ubuntu下Kafka安装及使用

Kafka是由Apache软件基金会开发的一个开源流处理平台,同时也是一个高吞吐量的分布式发布订阅消息系统。它由Scala和Java编写,具有多种特性和广泛的应用场景。 Kafka是一个分布式消息系统,它允许生产者(Producer)发布消…

CUDA error: no kernel image is available for execution on the device

记录一下出现上述问题的一个原因: pytorch所依赖的cuda版本不满足显卡(GPU)的算力要求! 举例来说,显卡是3090,并按照以下命令安装Pytorch: conda install pytorch1.7.0 torchvision0.8.0 torchaudio0.7.0 cudatoolkit10.1 -c p…

另外知识与网络总结

一、重谈NAT(工作在网络层) 为什么会有NAT 为了解决ipv4地址太少问题,到了公网的末端就会有运营商路由器来构建私网,在不同私网中私有IP可以重复,这就可以缓解IP地址太少问题,但是这就导致私有IP是重复的…

2024最新gewechat开发微信机器人教程说明

简介:本文将指导你如何搭建一个微信机器人,通过接入gewe框架实现智能回复与聊天功能。我们将从基础设置开始,逐步讲解如何配置机器人,并通过实例展示其实际应用。 随着人工智能技术的不断发展,智能机器人已经成为我们…

南沙csp-j/s一对一家教 解一本通题: 1937:【06NOIP普及组】数列

【题目描述】 给定一个正整数k(3≤k≤15),把所有k的方幂及所有有限个互不相等的k的方幂之和构成一个递增的序列,例如,当k3时,这个序列是: 1,3,4,9,10,12,13&a…

8,STM32CubeMX配置SPI工程(读取norflash的ID)

1,前言 单片机型号:STM32F407 编程环境 :STM32CubeMX Keil v5 硬件连接 :SPI1,CS/SS--->PB14 注:本工程在1,STM32CubeMX工程基础(配置Debug、时钟树)基础上完…

echarts饼图legend纵向分页

效果图 legend: {orient: vertical,type: scroll,bottom: 0,left: 10,icon: circle,height: 100, // 设置高度即可实现pageIconColor: #1b9aee, //翻页下一页的三角按钮颜色pageIconInactiveColor: #7f7f7f, //翻页(即翻页到头时)textStyle: {lineHei…

永辉超市自救三部曲:靠名创优品复制胖东来?如何避免另一个苏宁易购?

《港湾商业观察》施子夫 王璐 从潮流产品新锐向大型商超迈入,没有人想到名创优品(09896.HK;MNSO.US)会成为永辉超市(601933.SH)的第一大股东。 近63亿元的收购价让两家本就知名度颇高的企业在2024年的商业江湖中更加瞩目。然而…

C语言VS实用调试技巧

文章目录 一、什么是bug?二、什么是调试?三、Debug和Release四、VS调试快捷键4.1环境准备4.2调试快捷键 五、监视和内存观察5.1监视5.2内存 六、调试举例七、编程常见错误归类7.1编译型错误7.2链接型错误7.3运行时错误 一、什么是bug? 🍎bug本意是 “…

TypeScript 设计模式之【状态模式】

文章目录 状态模式:优雅切换的交通信号灯状态模式的奥秘状态模式有什么利与弊?如何使用状态模式来优化你的系统代码实现案例状态模式的主要优点状态模式的主要缺点状态模式的适用场景总结 状态模式:优雅切换的交通信号灯 当你站在繁忙的十字路口&#…

Vatee万腾平台:企业智能化生态的领航者

在科技日新月异的今天,企业的智能化转型已成为不可逆转的趋势。Vatee万腾平台,凭借其前瞻性的技术视野和不懈的创新精神,正逐步构建起一个以智能化为核心的新型商业生态,成为推动企业智能化升级的核心力量。 Vatee万腾平台深谙技…

大数据毕业设计选题推荐-程序员招聘数据分析系统-Hive-Hadoop-Spark

✨作者主页:IT研究室✨ 个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Python…

【中级通信工程师】终端与业务(六):市场环境与购买行为

【零基础3天通关中级通信工程师】 终端与业务(六):市场环境与购买行为 本文是中级通信工程师考试《终端与业务》科目第六章《市场环境与购买行为》的复习资料和真题汇总。本章的核心内容涵盖了通信市场环境、消费者市场的特点和动机、集团客户市场的采购过程等内容…

论文解析_客户分组对商业银行个人信用评分模型的提升作用研究,作者张亚京-中国人民银行征信中心博士后工作站

作者Toby,原文来源公众号:python风控模型,论文解析_客户分组对商业银行个人信用评分模型的提升作用研究 经典分组模型论文 大家好,我是Toby老师,之前发布过文章《银行客户分群模型-customer segmentation model-更好提升模型预测…

软件设计之Maven(2)

软件设计之Maven(2) 路线图推荐: 【Java学习路线-极速版】【Java架构师技术图谱】 尚硅谷新版Maven教程(高效入门maven,上手又快又稳) 资料可以去尚硅谷官网免费领取 学习内容: 依赖管理版本统一及维护依赖范围Buil…

【RabbitMQ】面试题

在本篇文章中,主要是介绍RabbitMQ一些常见的面试题。对于前几篇文章的代码,都已经在码云中给出,链接是mq-test: 学习RabbitMQ的一些简单案例 (gitee.com),如果存在问题的话欢迎各位提出,望共同进步。 MQ的作用以及应用…

【Redis】持久化机制--RDB和AOF

目录 1. RDB持久化 1.1 触发机制 1.2 流程说明 1.3 RDB文件的处理 1.4 RDB机制演示 1.5 RDB的优缺点 2. AOF持久化 2.1 使用AOF与基本演示 2.2 AOF的工作流程 2.3 文件同步(缓冲区刷新策略) 2.4 重写机制 2.5 AOF重写流程 2.6 启动时数据恢复 …

时序必读论文13|ICLR24 “又好又快”的线性SOTA时序模型FITS

论文标题:FITS: Modeling Time Series with 10k Parameters 开源代码:https://anonymous.4open.science/r/FITS/README.md 前言 FITS(Frequency Interpolation Time Series Analysis Baseline)这篇文章发表于ICLR2024&#xff…

Python自动化脚本,工作实现自动化附代码

Python是一种流行的编程语言,以其简洁和易读性而闻名。它提供了大量的库和模块,使其成为自动化各种任务的绝佳选择。 我们将探讨9个Python脚本及其代码,可以帮助您自动化各种任务并提高工作效率。无论您是开发人员、数据分析师还是只是想简化…