分类 | Hwcoder - Life Oriented Programming

学习笔记 46

强化学习 13

RL 学习笔记 #13 直接偏好优化（DPO）理论 RL 学习笔记 #12 OpenRLHF-PPO 实践 RL 学习笔记 #11 PPO 在 RLHF 中的应用 RL 学习笔记 #10 近端策略优化（PPO）理论 RL 学习笔记 #09 Actor-Critic 方法 RL 学习笔记 #08 策略梯度方法 RL 学习笔记 #07 值函数近似和 DQN 算法 RL 学习笔记 #06 时序差分学习算法 RL 学习笔记 #05 随机近似与随机梯度下降 RL 学习笔记 #04 蒙特卡洛学习算法 RL 学习笔记 #03 值迭代和策略迭代 RL 学习笔记 #02 贝尔曼公式 RL 学习笔记 #01 基本概念

机器学习 13

ML学习笔记 #13 协同过滤推荐算法 ML学习笔记 #12 异常检测 ML学习笔记 #11 主成分分析 ML学习笔记 #10 K-Means 聚类 ML学习笔记 #09 支持向量机 ML学习笔记 #08 数据集划分与误差分析 ML学习笔记 #07 神经网络：反向传播 ML学习笔记 #06 神经网络基础 ML学习笔记 #05 过拟合与正则化 ML学习笔记 #04 逻辑回归：二分类到多分类 ML学习笔记 #03 正规方程：多元线性回归 ML学习笔记 #02 梯度下降：多元线性回归 ML学习笔记 #01 梯度下降：一元线性回归

信息检索 11

IR学习笔记 #11 问答系统 IR学习笔记 #10 查询相关反馈 IR学习笔记 #09 网页排序 IR学习笔记 #08 倒排索引模型 IR学习笔记 #07 IRLbot IR学习笔记 #06 网络信息检索 IR学习笔记 #05 检索系统评价 IR学习笔记 #04 概率模型 IR学习笔记 #03 向量空间模型 IR学习笔记 #02 统计语言模型 IR学习笔记 #01 概论&布尔模型

PR学习笔记 #5 判别式 vs. 生成式 PR学习笔记 #4 概率密度：非参数估计 PR学习笔记 #3 概率密度：参数估计 PR学习笔记 #2 贝叶斯分类器 PR学习笔记 #1 KNN 分类器

软件工程应试笔记 #2 软件工程应试笔记 #1 数据库系统应试笔记数理逻辑应试笔记

算法笔记 23

力扣刷题 15

力扣刷题笔记 #13 树力扣刷题笔记 #12 字符串力扣刷题笔记 #11 栈&队列力扣刷题笔记 #10 搜索&剪枝力扣刷题笔记 #09 数学力扣刷题笔记 #08 链表力扣刷题笔记 #07 贪心算法力扣刷题笔记 #06 图论力扣刷题笔记 #05-3 复杂动态规划力扣刷题笔记 #05-2 二维动态规划力扣刷题笔记 #05-1 一维动态规划力扣刷题笔记 #04 二分&分治力扣刷题笔记 #03 数据结构力扣刷题笔记 #02 数位&二进制力扣刷题笔记 #01 数组

手撕经典算法 6

手撕经典算法 #6 RLHF篇手撕经典算法 #5 机器学习篇手撕经典算法 #4 经典函数篇手撕经典算法 #3 Transformer篇手撕经典算法 #2 神经网络篇手撕经典算法 #1 Attention篇

算法入门笔记 #2 STL标准库算法入门笔记 #1 杂记

从近期开源模型看工具调用格式的分化 OpenAI o3 与 Monte-Carlo 思想 OpenAI o1 系列模型背后的技术猜测

Uplift Recommendation 论文汇总浅谈 Uplift Modeling

自然语言处理 1

复旦 NLP-LI 课题组近期论文索引

常用 Prompt 合集科研常用网站合集 How to Read a Paper ?

2022年保研回忆录 Everyone Has Their Own Time Zone

DB课程项目-校园食堂点餐系统-开发文档 IR课程项目-文学检索-开发文档