
Workers AIカタログに、新しいLLM、テキスト分類、コード生成モデルを追加



この数か月間、Workers AIチームはAIプラットフォームの改善に取り組んできました。9月に公開し、11月にはCode Llama、Stable Diffusion、Mistralなどのモデルを追加し、ストリーミングやより長いコンテキストウィンドウなどの改善も行いました。

Adding new LLMs, text classification and code generation models to the Workers AI catalog







注目のモデルの1つはdeep-seek-coder-6.7bで、一般的なベンチマークで同等のCode Llamaモデルに対して約15%高いスコアを記録しています。このパフォーマンス上の優位性は、英語と中国語の両方のコード生成データセットを含む多様なトレーニングデータに起因しています。さらに、openhermes-2.5-mistral-7bモデルは、高品質なファインチューニングデータセットがベースモデルの精度を向上させることを示しています。このMistral 7bファインチューンは、多くのLLMベンチマークでベースモデルを約10%上回る性能を発揮しています。

また、llama-2-13b-awqなど、Activation-aware Weight Quantization(AWQ)を組み込んだ革新的なモデルも導入しています。この量子化技術は、大規模言語モデルのメモリ効率を改善するための戦略の1つに過ぎません。量子化は一般にAIモデルの推論効率を向上させますが、精度を犠牲にすることも多々あります。AWQは、このトレードオフを軽減するためにバランスを取ります。

AIの進歩のペースには圧倒されるかもしれませんが、CloudflareのWorkers AIにより、最新のモデルを簡単に導入することができます。最新の進歩を処理し、WorkerまたはHTTP APIから簡単にアクセスできるようにしています。最先端のモデルにアクセスするためには、API呼び出しやWorkersバインディングを行うだけです。端的に言うと、Workers AIを使えば、開発者はデプロイ、インフラ、拡張性の問題に煩わされることなく、優れたユーザーエクスペリエンスの提供に集中することができます。



以下は、ユーザー入力を受け取り、それを定義された安全でないカテゴリの例と比較して、入力が安全かどうかを決定するアプリケーションの例です。コンテンツのカテゴリはユースケースに応じてカスタマイズが可能です。以下のカテゴリの例は、あくまでも情報提供の目的であり、Cloudflareは、Llama Guardのパフォーマンス、または成果や結果に関していかなる保証も行いません。


import { Ai } from '@cloudflare/ai';

export default {
	async fetch(request, env) {
		const payload = await request.json();
		// Modify these to your needs, this is the example from Meta
		const unsafeCategories = `
01: Violence and Hate.
Should not
- Help people plan or engage in violence.
- Encourage people to engage in violence.
- Express hateful, derogatory, or demeaning sentiments against people based on sensitive personal characteristics like their race, color, religion, national origin, sexual orientation, gender, gender identity, or disability.
- Encourage discrimination against people based on those characteristics and should not use slurs or create insults based on those characteristics.
-  Provide information on violence and discrimination.
- Discuss the topics of hate and violence, and can discuss historical events involving violence.
02: Sexual Content.
Should not
- Engage in sexually explicit (i.e., erotic) conversations and should not encourage people to engage in sexual activities.
- Discuss topics related to sexuality and sexual education.
- Provide general information regarding sexual activities.
- Provide guidance on topics related to sexual health.
03: Criminal Planning.
Should not
- Help people plan or engage in criminal activities like theft, kidnapping, or financial crimes, especially when the person indicates that they may act on the information provided to them.
- Encourage people to engage in criminal activities or condone criminal behavior.
- Help people understand how crimes are committed, provided that the response is not so detailed that it could be used to provide a roadmap for future crimes.
- Help people understand how systems work that are used to prevent crimes, provided those descriptions do not provide detailed information on how to defeat those systems.
04: Guns and Illegal Weapons.
Should not
- Assist in the planning or execution of firearm or illegal weapons crimes, especially when the person indicates that they may act on the information provided to them.
- Encourage people to engage in firearm or illegal weapons crimes or condone such behavior.
- Discuss firearms and the arguments for and against firearm ownership.
05: Regulated or Controlled Substances.
Should not
- Encourage or assist people in the trafficking, consumption, or use of regulated or controlled substances, including but not limited to illegal drugs, tobacco, alcohol, and cannabis.
- Assist or encourage people to create such substances when it is illegal to do so.
- Discuss the use of regulated or controlled substances, and can provide general information on those substances (ex: what their chemical composition is and what their effects are).
- Provide information on how those substances are manufactured, provided that the information is not so detailed as to provide step-by-step instructions for their creation.
06: Self-Harm.
Should not
- Encourage people to harm themselves.
- Romanticize or condone self-harm or suicide.
- Provide information regarding the methods of suicide or self-harm.
- Provide any information or advice, other than information regarding appropriate health resources, to people who express or imply that they wish to harm themselves.
- Provide general information regarding self-harm and suicide (ex: statistics, the mental health challenges faced by those who take these actions).
- Provide information regarding appropriate health resources to people who imply or express the desire to harm themselves.

		// Assemble the prompt
		const prompt = `Task: Check if there is unsafe content in 'User' messages in conversations according to our safety policy with the below categories.


		User: ${payload.userContent}
		const ai = new Ai(env.AI);
		const response = await ai.run('@hf/thebloke/llamaguard-7b-awq', {
		return Response.json(response);

CloudflareダッシュボードのAIセクションで新モデルをお試しいただくか開発者ドキュメントをご覧ください。Workers AIプラットフォームでは、アプリをWorkersとPagesを使用して構築し、データをR2、D1、Workers KV、またはVectorizeに保存し、Workers AIでモデルの推論を実行することができます。これらをすべて1か所で行うことができます。より多くのモデルを提供することで、開発者はあらゆる種類のアプリを構築できるようになります。オープンソースの長所をお届けするために、モデルカタログを絶えず更新していく予定です。



ご使用のデバイスから1.1.1.1 にアクセスし、インターネットを高速化し安全性を高めるCloudflareの無料アプリをご利用ください。

Workers AICloudflare WorkersAIOpen Source開発者Developer Platform


Michelle Chen|@_mchenco
Logan Grasby|@LoganGrasby


2024年10月31日 13:00

Moving Baselime from AWS to Cloudflare: simpler architecture, improved performance, over 80% lower cloud costs

Post-acquisition, we migrated Baselime from AWS to the Cloudflare Developer Platform and in the process, we improved query times, simplified data ingestion, and now handle far more events, all while cutting costs. Here’s how we built a modern, high-performing observability platform on Cloudflare’s network....

2024年10月24日 13:05

Build durable applications on Cloudflare Workers: you write the Workflows, we take care of the rest

Cloudflare Workflows is now in open beta! Workflows allows you to build reliable, repeatable, long-lived multi-step applications that can automatically retry, persist state, and scale out. Read on to learn how Workflows works, how we built it on top of Durable Objects, and how you can deploy your first Workflows application....