Search: objective design

Guardrails Intermediate

Rules and controls around generation (filters, validators, structured outputs) to reduce unsafe or invalid behavior.

Reinforcement Learning

Data Poisoning Intermediate

Maliciously inserting or altering training data to implant backdoors or degrade performance.

Foundations & Theory

Pruning Intermediate

Removing weights or neurons to shrink models and improve efficiency; can be structured or unstructured.

Foundations & Theory

Convex Optimization Intermediate

Optimization problems where any local minimum is global.

AI Economics & Strategy

Non-Convex Optimization Intermediate

Optimization with multiple local minima/saddle points; typical in neural networks.

AI Economics & Strategy

On-Policy Learning Intermediate

Learning only from current policy’s data.

AI Economics & Strategy

Policy Gradient Intermediate

Optimizing policies directly via gradient ascent on expected reward.

AI Economics & Strategy

Denoising Diffusion Probabilistic Model Advanced

Diffusion model trained to remove noise step by step.

Diffusion & Generative Models

Diffusion Model Advanced

Generative model that learns to reverse a gradual noise process.

Diffusion & Generative Models

Autoencoder Advanced

Model that compresses input into latent space and reconstructs it.

Diffusion & Generative Models

Variational Autoencoder Advanced

Autoencoder using probabilistic latent variables and KL regularization.

Diffusion & Generative Models

Expectation Advanced

Average value under a distribution.

Probability & Statistics

GAN Advanced

Two-network setup where generator fools a discriminator.

Diffusion & Generative Models

Trust Region Intermediate

Restricting updates to safe regions.

Foundations & Theory

Constrained Optimization Intermediate

Optimization under equality/inequality constraints.

Foundations & Theory

Inner Alignment Advanced

Ensuring learned behavior matches intended objective.

AI Safety & Alignment

Mesa-Optimizer Advanced

Learned subsystem that optimizes its own objective.

AI Safety & Alignment

Model Predictive Control Intermediate

Optimizes future actions using a model of dynamics.

Foundations & Theory

Linear Quadratic Regulator Intermediate

Optimal control for linear systems with quadratic cost.

Foundations & Theory

Robust Control Intermediate

Control that remains stable under model uncertainty.

Foundations & Theory

System Identification Advanced

Learning physical parameters from data.

Simulation & Sim-to-Real

Behavior Cloning Advanced

Learning action mapping directly from demonstrations.

Reinforcement Learning

Alignment Tax Advanced

Tradeoff between safety and performance.

AI Safety & Alignment

Weight Initialization Intermediate

Methods to set starting weights to preserve signal/gradient scales across layers.

Foundations & Theory

Vocabulary Intermediate

The set of tokens a model can represent; impacts efficiency, multilinguality, and handling of rare strings.

Transformers & LLMs

Context Window Intermediate

Maximum number of tokens the model can attend to in one forward pass; constrains long-document reasoning.

Transformers & LLMs

System Prompt Intermediate

A high-priority instruction layer setting overarching behavior constraints for a chat model.

Reinforcement Learning

A/B Testing Intermediate

Controlled experiment comparing variants by random assignment to estimate causal effects of changes.

Foundations & Theory

Experiment Tracking Intermediate

Logging hyperparameters, code versions, data snapshots, and results to reproduce and compare experiments.

Evaluation & Benchmarking

Throughput Intermediate

How many requests or tokens can be processed per unit time; affects scalability and cost.

Transformers & LLMs

Results for "objective design"

Welcome to AI Glossary

Search

Browse

3D WordGraph