浏览所有 Claude 技能

探索我们完整的 Claude 技能集合，扩展 AI 代理的能力。

LlamaGuard AI Content Moderation

Moderates LLM inputs and outputs using Meta's specialized LlamaGuard models to ensure safety and policy compliance across six critical categories.

3,983

GRPO RL Training Specialist

Implements Group Relative Policy Optimization (GRPO) for reasoning and task-specific model alignment using the TRL library.

3,983

TensorBoard ML Visualization

Visualizes machine learning training metrics, model architectures, and performance profiles using Google's TensorBoard toolkit.

3,983

AWQ LLM Quantization & Optimization

Optimizes Large Language Models using 4-bit activation-aware weight quantization to achieve 3x faster inference with minimal accuracy loss.

3,983

LM Evaluation Harness

Evaluates Large Language Models across 60+ academic benchmarks using standardized prompts and metrics for reproducible research.

3,983

Outlines Structured Generation

Ensures guaranteed valid JSON, XML, and type-safe code generation from LLMs using constrained token sampling and Pydantic models.

3,983

NeMo LLM Evaluator

Evaluates Large Language Models across 100+ industry-standard benchmarks using NVIDIA's enterprise-grade containerized architecture.

3,983

NeMo Curator Data Processing

Accelerates LLM data curation using GPU-powered deduplication, quality filtering, and PII redaction at scale.

3,983

TorchTitan LLM Pretraining

Accelerates large-scale LLM pretraining using PyTorch-native 4D parallelism and Float8 optimization.

3,983

GGUF Model Quantization

Optimizes large language models for efficient local inference using GGUF format and llama.cpp quantization techniques.

3,983

BigCode Evaluation Harness

Evaluates AI code generation models using industry-standard benchmarks and pass@k metrics.

3,983

OpenRLHF Model Training

Deploys and manages high-performance RLHF training pipelines for large-scale language models using Ray and vLLM acceleration.

3,983

DeepSpeed Distributed Training

Optimizes large-scale model training using DeepSpeed configurations, ZeRO optimization stages, and high-performance I/O management.

3,983

nnsight Remote Interpretability

Interprets and manipulates neural network internals across local and remote models using the nnsight library and NDIF execution.

3,983

LangSmith LLM Observability

Monitors, debugs, and evaluates large language model applications with comprehensive tracing and systematic testing tools.

3,983

NeMo Guardrails Safety Alignment

Implements programmable safety rails and runtime validation for LLM applications using NVIDIA's NeMo Guardrails framework.

3,983

Qdrant Vector Search

Manages high-performance vector similarity search and scalable storage for production RAG and semantic search systems.

3,983

LLM Quantization with bitsandbytes

Quantizes Large Language Models to 8-bit or 4-bit formats to reduce memory usage by up to 75% with minimal accuracy loss.

3,983

LitGPT LLM Implementation & Training

Implements, fine-tunes, and deploys high-performance Large Language Models using Lightning AI's LitGPT framework.

3,983

PyTorch FSDP2 Distributed Training

Implements advanced PyTorch FSDP2 sharding and distributed checkpointing for efficient large-scale model training.

3,983

Model Merging & Fusion

Combines multiple fine-tuned AI models into a single high-performance model without requiring additional training or expensive GPU resources.

3,983

RWKV Model Architecture

Implements and manages RWKV architectures for efficient, linear-time AI inference and long-context processing.

3,983

Lambda Labs GPU Cloud

Provisions and manages high-performance GPU infrastructure on Lambda Labs for machine learning training and inference workflows.

3,983

HuggingFace Accelerate Distributed Training

Simplifies PyTorch distributed training across multiple GPUs, TPUs, and nodes with minimal code changes and a unified API.

3,983

MLflow MLOps Manager

Manage the complete machine learning lifecycle including experiment tracking, model versioning, and deployment using the MLflow framework.

3,983

Chroma Vector Database

Manages high-performance vector embeddings and metadata for RAG applications and semantic search using the open-source Chroma database.

3,983

GPTQ Model Quantization

Compresses large language models to 4-bit precision to enable high-speed inference and deployment on consumer-grade hardware.

3,983

Speculative Decoding & Inference Optimization

Accelerates LLM inference speed by up to 3.6x using speculative decoding, Medusa heads, and lookahead techniques without sacrificing model quality.

3,983

LLaMA-Factory Fine-Tuning

Streamlines the fine-tuning of 100+ large language models using LLaMA-Factory with support for QLoRA and multimodal architectures.

3,983

30 results loaded • More available

Scroll for more results...

浏览所有 Claude 技能

LlamaGuard AI Content Moderation

GRPO RL Training Specialist

TensorBoard ML Visualization

AWQ LLM Quantization & Optimization

LM Evaluation Harness

Outlines Structured Generation

NeMo LLM Evaluator

NeMo Curator Data Processing

TorchTitan LLM Pretraining

GGUF Model Quantization

BigCode Evaluation Harness

OpenRLHF Model Training

DeepSpeed Distributed Training

nnsight Remote Interpretability

LangSmith LLM Observability

NeMo Guardrails Safety Alignment

Qdrant Vector Search

LLM Quantization with bitsandbytes

LitGPT LLM Implementation & Training

PyTorch FSDP2 Distributed Training

Model Merging & Fusion

RWKV Model Architecture

Lambda Labs GPU Cloud

Modal Serverless GPU

HuggingFace Accelerate Distributed Training

MLflow MLOps Manager

Chroma Vector Database

GPTQ Model Quantization

Speculative Decoding & Inference Optimization

LLaMA-Factory Fine-Tuning

浏览所有 Claude 技能

LlamaGuard AI Content Moderation

GRPO RL Training Specialist

TensorBoard ML Visualization

AWQ LLM Quantization & Optimization

LM Evaluation Harness

Outlines Structured Generation

NeMo LLM Evaluator

NeMo Curator Data Processing

TorchTitan LLM Pretraining

GGUF Model Quantization

BigCode Evaluation Harness

OpenRLHF Model Training

DeepSpeed Distributed Training

nnsight Remote Interpretability

LangSmith LLM Observability

NeMo Guardrails Safety Alignment

Qdrant Vector Search

LLM Quantization with bitsandbytes

LitGPT LLM Implementation & Training

PyTorch FSDP2 Distributed Training

Model Merging & Fusion

RWKV Model Architecture

Lambda Labs GPU Cloud

Modal Serverless GPU

HuggingFace Accelerate Distributed Training

MLflow MLOps Manager

Chroma Vector Database

GPTQ Model Quantization

Speculative Decoding & Inference Optimization

LLaMA-Factory Fine-Tuning