<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  xmlns:xhtml="http://www.w3.org/1999/xhtml">
  <url>
    <loc>https://lilianweng.github.io/tags/language-model/</loc>
    <lastmod>2025-05-01T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/</loc>
    <lastmod>2025-05-01T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/long-read/</loc>
    <lastmod>2025-05-01T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/</loc>
    <lastmod>2025-05-01T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/reasoning/</loc>
    <lastmod>2025-05-01T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/reinforcement-learning/</loc>
    <lastmod>2025-05-01T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/</loc>
    <lastmod>2025-05-01T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2025-05-01-thinking/</loc>
    <lastmod>2025-05-01T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/alignment/</loc>
    <lastmod>2024-11-28T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2024-11-28-reward-hacking/</loc>
    <lastmod>2024-11-28T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/rlhf/</loc>
    <lastmod>2024-11-28T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/safety/</loc>
    <lastmod>2024-11-28T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2024-07-07-hallucination/</loc>
    <lastmod>2024-07-07T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/factuality/</loc>
    <lastmod>2024-07-07T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/hallucination/</loc>
    <lastmod>2024-07-07T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/nlp/</loc>
    <lastmod>2024-07-07T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2024-04-12-diffusion-video/</loc>
    <lastmod>2024-04-12T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/generative-model/</loc>
    <lastmod>2024-04-12T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/video-generation/</loc>
    <lastmod>2024-04-12T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/data/</loc>
    <lastmod>2024-02-05T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/data-quality/</loc>
    <lastmod>2024-02-05T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/human-ai/</loc>
    <lastmod>2024-02-05T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2024-02-05-human-data-quality/</loc>
    <lastmod>2024-02-05T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/adversarial-attacks/</loc>
    <lastmod>2023-10-25T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2023-10-25-adv-attack-llm/</loc>
    <lastmod>2023-10-25T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/redteam/</loc>
    <lastmod>2023-10-25T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/robustness/</loc>
    <lastmod>2023-10-25T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/agent/</loc>
    <lastmod>2023-06-23T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2023-06-23-agent/</loc>
    <lastmod>2023-06-23T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/prompting/</loc>
    <lastmod>2023-06-23T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/steerability/</loc>
    <lastmod>2023-06-23T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2023-03-15-prompt-engineering/</loc>
    <lastmod>2023-03-15T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/architecture/</loc>
    <lastmod>2023-01-27T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/attention/</loc>
    <lastmod>2023-01-27T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/foundation/</loc>
    <lastmod>2023-01-27T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2023-01-27-the-transformer-family-v2/</loc>
    <lastmod>2023-01-27T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/transformer/</loc>
    <lastmod>2023-01-27T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2023-01-10-inference-optimization/</loc>
    <lastmod>2023-01-10T10:00:00-07:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/long-read/</loc>
    <lastmod>2023-01-10T10:00:00-07:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/learning-dynamics/</loc>
    <lastmod>2022-09-08T10:00:00-07:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/neural-tangent-kernel/</loc>
    <lastmod>2022-09-08T10:00:00-07:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2022-09-08-ntk/</loc>
    <lastmod>2022-09-08T10:00:00-07:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2022-06-09-vlm/</loc>
    <lastmod>2022-06-09T15:10:30-07:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/vision-language-model/</loc>
    <lastmod>2022-06-09T15:10:30-07:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/vision-model/</loc>
    <lastmod>2022-06-09T15:10:30-07:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/data-augmentation/</loc>
    <lastmod>2022-04-15T15:10:30-07:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/data-generation/</loc>
    <lastmod>2022-04-15T15:10:30-07:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2022-04-15-data-gen/</loc>
    <lastmod>2022-04-15T15:10:30-07:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/active-learning/</loc>
    <lastmod>2022-02-20T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2022-02-20-active-learning/</loc>
    <lastmod>2022-02-20T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2021-12-05-semi-supervised/</loc>
    <lastmod>2021-12-05T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/unsupervised-learning/</loc>
    <lastmod>2021-12-05T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2021-09-25-train-large/</loc>
    <lastmod>2021-09-24T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/image-generation/</loc>
    <lastmod>2021-07-11T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/math-heavy/</loc>
    <lastmod>2021-07-11T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2021-07-11-diffusion-models/</loc>
    <lastmod>2021-07-11T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2021-05-31-contrastive/</loc>
    <lastmod>2021-05-31T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/representation-learning/</loc>
    <lastmod>2021-05-31T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2021-03-21-lm-toxicity/</loc>
    <lastmod>2021-03-21T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2021-01-02-controllable-text-generation/</loc>
    <lastmod>2021-01-02T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/reinforcement-learning/</loc>
    <lastmod>2021-01-02T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2020-10-29-odqa/</loc>
    <lastmod>2020-10-29T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/auto-ml/</loc>
    <lastmod>2020-08-06T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/evolution/</loc>
    <lastmod>2020-08-06T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2020-08-06-nas/</loc>
    <lastmod>2020-08-06T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/exploration/</loc>
    <lastmod>2020-06-07T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2020-06-07-exploration-drl/</loc>
    <lastmod>2020-06-07T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2020-04-07-the-transformer-family/</loc>
    <lastmod>2020-04-07T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2020-01-29-curriculum-rl/</loc>
    <lastmod>2020-01-29T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/meta-learning/</loc>
    <lastmod>2020-01-29T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/object-recognition/</loc>
    <lastmod>2019-11-10T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2019-11-10-self-supervised/</loc>
    <lastmod>2019-11-10T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2019-09-05-evolution-strategies/</loc>
    <lastmod>2019-09-05T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2019-06-23-meta-rl/</loc>
    <lastmod>2019-06-23T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2019-05-05-domain-randomization/</loc>
    <lastmod>2019-05-05T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/robotics/</loc>
    <lastmod>2019-05-05T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2019-03-14-overfit/</loc>
    <lastmod>2019-03-14T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/information-theory/</loc>
    <lastmod>2019-03-14T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2019-01-31-lm/</loc>
    <lastmod>2019-01-31T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2018-12-27-object-recognition-part-4/</loc>
    <lastmod>2018-12-27T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/object-detection/</loc>
    <lastmod>2018-12-27T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2018-11-30-meta-learning/</loc>
    <lastmod>2018-11-30T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2018-10-13-flow-models/</loc>
    <lastmod>2018-10-13T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/autoencoder/</loc>
    <lastmod>2018-08-12T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2018-08-12-vae/</loc>
    <lastmod>2018-08-12T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2018-06-24-attention/</loc>
    <lastmod>2018-06-24T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/rnn/</loc>
    <lastmod>2018-06-24T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2018-05-05-drl-implementation/</loc>
    <lastmod>2018-05-05T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/tensorflow/</loc>
    <lastmod>2018-05-05T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/tutorial/</loc>
    <lastmod>2018-05-05T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2018-04-08-policy-gradient/</loc>
    <lastmod>2018-04-08T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2018-02-19-rl-overview/</loc>
    <lastmod>2018-02-19T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2018-01-23-multi-armed-bandit/</loc>
    <lastmod>2018-01-23T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2017-12-31-object-recognition-part-3/</loc>
    <lastmod>2017-12-31T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2017-12-15-object-recognition-part-2/</loc>
    <lastmod>2017-12-15T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2017-10-29-object-recognition-part-1/</loc>
    <lastmod>2017-10-29T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2017-10-15-word-embedding/</loc>
    <lastmod>2017-10-15T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2017-09-28-information-bottleneck/</loc>
    <lastmod>2017-09-28T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2017-08-20-gan/</loc>
    <lastmod>2017-08-20T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/tags/gan/</loc>
    <lastmod>2017-08-20T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2017-08-01-interpretation/</loc>
    <lastmod>2017-08-01T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2017-07-22-stock-rnn-part-2/</loc>
    <lastmod>2017-07-22T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2017-07-08-stock-rnn-part-1/</loc>
    <lastmod>2017-07-08T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/posts/2017-06-21-overview/</loc>
    <lastmod>2017-06-21T00:00:00+00:00</lastmod>
  </url><url>
    <loc>https://lilianweng.github.io/archives/</loc>
  </url><url>
    <loc>https://lilianweng.github.io/categories/</loc>
  </url><url>
    <loc>https://lilianweng.github.io/faq/</loc>
  </url><url>
    <loc>https://lilianweng.github.io/search/</loc>
  </url>
</urlset>
