huangyedi2012

Prompt Engineering

发表于 2025-05-23 更新于 2025-05-26 分类于 llm

提示工程不仅仅是关于设计和研发提示词。它包含了与大语言模型交互和研发的各种技能和技术。

发表于 2025-04-29 更新于 2025-08-08 分类于 llm

Megatron-LM 是一个基于 Megatron-Core 实现高效大模型训练的框架。

Megatron-core是一个GPU 优化的训练技术库，专注于提升大模型训练的性能和效率。

发表于 2025-03-05 更新于 2025-08-09 分类于 framework

为了解决算力增速不足的问题，人们考虑用多节点集群进行分布式训练，以提升算力，分布式训练势在必行。

发表于 2025-03-05 更新于 2025-04-19 分类于 tool

Deepspeed训练大模型细节

发表于 2025-02-20 分类于 llm

DeepSeek相关技术报告

发表于 2024-12-30 分类于 nlp

激活函数介绍。

发表于 2024-12-30 更新于 2025-04-19 分类于 llm

LLaMA系列论文

发表于 2024-09-23 分类于 ml

熵通常用来评价随机变量的不确定性；交叉熵是评价两个概率分布之间的差异；KL散度是评价两个概率分布之间的相对熵差。

发表于 2024-09-05 更新于 2025-04-29 分类于 nlp

强化学习（Reinforcement Learning, RL）的主要目的是让智能体（agent）通过与环境的交互，学习一种策略（policy），从而在不同状态下采取最优的行动，以最大化其累积的奖励（或收益）。

发表于 2024-08-01 更新于 2024-08-15 分类于 nlp

记录大模型学习过程中的问题。