Search: preference optimization

MLOps Intermediate

Practices for operationalizing ML: versioning, CI/CD, monitoring, retraining, and reliable production management.

MLOps & Infrastructure

Adversarial Example Intermediate

Inputs crafted to cause model errors or unsafe behavior, often imperceptible in vision or subtle in text.

Foundations & Theory

Pruning Intermediate

Removing weights or neurons to shrink models and improve efficiency; can be structured or unstructured.

Foundations & Theory

Data Poisoning Intermediate

Maliciously inserting or altering training data to implant backdoors or degrade performance.

Foundations & Theory

Model Stealing Intermediate

Reconstructing a model or its capabilities via API queries or leaked artifacts.

Foundations & Theory

Computer Vision Intermediate

AI focused on interpreting images/video: classification, detection, segmentation, tracking, and 3D understanding.

Computer Vision

Segmentation Intermediate

Assigning labels per pixel (semantic) or per instance (instance segmentation) to map object boundaries.

Computer Vision

Fisher Information Intermediate

Measures how much information an observable random variable carries about unknown parameters.

AI Economics & Strategy

Maximum Likelihood Estimation Intermediate

Estimating parameters by maximizing likelihood of observed data.

AI Economics & Strategy

Sharp Minimum Intermediate

A narrow minimum often associated with poorer generalization.

AI Economics & Strategy

Flat Minimum Intermediate

A wide basin often correlated with better generalization.

AI Economics & Strategy

Warmup Intermediate

Gradually increasing learning rate at training start to avoid divergence.

AI Economics & Strategy

Sparse Attention Intermediate

Attention mechanisms that reduce quadratic complexity.

AI Economics & Strategy

Gradient Leakage Intermediate

Recovering training data from gradients.

AI Economics & Strategy

Model Inversion Intermediate

Inferring sensitive features of training data.

AI Economics & Strategy

SLAM Intermediate

Simultaneous Localization and Mapping for robotics.

Computer Vision

3D Reconstruction Intermediate

Recovering 3D structure from images.

Computer Vision

Forecasting Intermediate

Predicting future values from past observations.

Time Series

Feedback Loop Intermediate

Using production outcomes to improve models.

MLOps & Infrastructure

Training Cost Intermediate

Cost of model training.

AI Economics & Strategy

Inner Product Advanced

Measures similarity and projection between vectors.

Mathematics

Condition Number Advanced

Sensitivity of a function to input perturbations.

Mathematics

Jacobian Advanced

Matrix of first-order derivatives for vector-valued functions.

Mathematics

Gradient Advanced

Direction of steepest ascent of a function.

Mathematics

Covariance Advanced

Measures joint variability between variables.

Probability & Statistics

Reward Hacking Advanced

Maximizing reward without fulfilling real goal.

AI Safety & Alignment

Mesa-Optimizer Advanced

Learned subsystem that optimizes its own objective.

AI Safety & Alignment

Scalable Oversight Advanced

Using limited human feedback to guide large models.

AI Safety & Alignment

Constraint Prompting Intro

Explicit output constraints (format, tone).

Prompting & Instructions

Reflection Prompting Intro

Asking model to review and improve output.

Prompting & Instructions

Results for "preference optimization"

Welcome to AI Glossary

Search

Browse

3D WordGraph