Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Claude 推出针对开发者自动生成提示词 并测试提示效果的工具

by 小互
2024年7月10日
in XiaoHu.AI日报
0 0
0
Claude 推出针对开发者自动生成提示词 并测试提示效果的工具
0
SHARES
678
VIEWS
Share on FacebookShare on Twitter

在构建人工智能驱动的应用程序时,提示词的质量对结果有重大影响。然而,编写高质量的提示词具有挑战性,需要深入了解应用程序的需求和对大型语言模型的专业知识。为了加速开发并改进结果,Anthropic简化了这一过程,使用户更容易生成高质量的提示词。

现在,用户可以在Anthropic控制台中生成、测试和评估提示词。

生成提示

  • 目的:帮助开发者创建有效的提示词,以指导AI模型生成所需的响应。
  • 功能:通过描述任务(例如“分类入站客户支持请求”),控制台内置的提示词生成器会利用Claude 3.5 Sonnet来自动生成高质量的提示词。

编写一个好的提示可以像向Claude描述任务一样简单。控制台提供了一个内置提示生成器,由Claude 3.5 Sonnet驱动。您只需描述任务(例如,“分类处理入境客户支持请求”),Claude就能为您生成高质量的提示。

Anthropic控制台提示生成器的应用屏幕

您可以使用Claude的新测试用例生成功能为提示生成输入变量,例如一个入境的客户支持消息,然后运行提示以查看Claude的响应。您也可以手动输入测试用例。

提示生成和Claude响应的应用屏幕

生成测试套件

  • 目的:在提示词部署到生产环境之前,通过各种真实世界的输入来测试提示词的质量和效果。
  • 功能:用户可以自动生成或手动添加测试用例(例如客户支持消息),并运行这些用例以查看Claude的响应。

通过对一系列真实世界输入进行测试,您可以在将提示部署到生产环境之前,对其质量建立信心。使用新的评估功能,您可以直接在控制台中完成这一操作,而无需手动管理电子表格或代码中的测试。

您可以手动添加或从CSV导入新测试用例,也可以使用“生成测试用例”功能让Claude自动生成测试用例。根据需要修改您的测试用例,然后一键运行所有测试用例。查看并调整Claude对每个变量生成需求的理解,以便更精细地控制Claude生成的测试用例。

不同提示响应的比较模式的应用屏幕

评估模型响应并迭代提示

  • 目的:快速改进提示词和AI模型的性能。新的“评估”选项卡使您能够自动创建测试用例,以评估您的提示与真实世界输入的匹配情况。 根据需要修改您的测试用例,然后一键运行所有测试用例。
  • 功能:用户可以创建提示词的新版本,重新运行测试用例,快速迭代和改进结果。新增的功能允许对比多个提示词输出,并由专家对响应质量进行评分,以进一步改进提示词质量。
  • 输出结果比较和评分:用户现在可以并排比较两个或多个提示的输出结果。通过这个功能,主题专家可以在5分制上对不同版本的提示响应进行评分,从而选择最佳提示。

 

开始使用:https://console.anthropic.com/

原文:https://www.anthropic.com/news/evaluate-prompts

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
494
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
346
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
460
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
284
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
636
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
435

Recommendeds

Cohere Compass:一种面向多方面数据的先进基础嵌入模型

Cohere Compass:一种面向多方面数据的先进基础嵌入模型

79 VIEWS
2024年4月16日
D-ID推出了两款新数字人工具 只需一分钟视频训练即可生成 支持复杂表现

D-ID推出了两款新数字人工具 只需一分钟视频训练即可生成 支持复杂表现

250 VIEWS
2024年11月1日
马里兰大学开发出一种”隐形斗篷” 可以让监控无法识别到你

马里兰大学开发出一种”隐形斗篷” 可以让监控无法识别到你

1.2k VIEWS
2024年4月13日
TxT360:一个用于大语言模型训练的全球去重的高质量数据集 5.7万亿个高质量的tokens

TxT360:一个用于大语言模型训练的全球去重的高质量数据集 5.7万亿个高质量的tokens

271 VIEWS
2024年10月8日
教程:只需合适的提示词 使用 ChatGPT 在 Blender 中创建3D场景

教程:只需合适的提示词 使用 ChatGPT 在 Blender 中创建3D场景

211 VIEWS
2024年6月5日
Suno发布音频输入功能 用户可以使用任何声音随时随地创作歌曲

Suno发布音频输入功能 用户可以使用任何声音随时随地创作歌曲

429 VIEWS
2024年6月13日
InternVL:GPT-4V开源替代方案 最接近 GPT-4V 表现的可商用开源模型

InternVL:GPT-4V开源替代方案 最接近 GPT-4V 表现的可商用开源模型

489 VIEWS
2024年4月29日
RT-H:让机器人学会根据人类语言描述执行任务

RT-H:让机器人学会根据人类语言描述执行任务

64 VIEWS
2024年3月7日
DreamWorld AI:仅靠单镜头摄像设备精确捕捉全身运动和表情

DreamWorld AI:仅靠单镜头摄像设备精确捕捉全身运动和表情

276 VIEWS
2024年4月11日
教程:成本不到2美金 使用你自己的照片 训练 一个自己的 FLUX LoRA

教程:成本不到2美金 使用你自己的照片 训练 一个自己的 FLUX LoRA

444 VIEWS
2024年9月3日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版