• 马来西亚留学,公立大学怎么申请?Top5本硕博 马来西亚留学,公立大学怎么申请?Top5本硕博
  • Ollama使用指南【超全版】 Ollama使用指南【超全版】

优选专题 专栏

  • 2025 LeetCode Data Structures and Algorithms

    算法和开发面试的时候,一般会给一到两个编程题目。Leecode上面对 3,000 多个问题,很容易感到不知所措和迷失。 如何刷题? 了解基础知识 算法复杂性 基本数据结构,如数组、字符串、链表、堆栈、队列、哈希表和二…

    10/06/2025
    0210
  • 持续集成和部署 (CI/CD)和测试

    CI/CD 持续集成 (CI) 和持续部署 (CD) 是自动构建、测试和部署代码更改的流程。CI 是在代码更改提交到代码存储库后立即自动生成和测试代码更改的过程。CD 是在代码更改通过 CI 测试后自动将代码更改部署到生产…

    10/06/2025
    0280
  • functools高级编程技巧,Python代码优雅神器

    partial() 从概念上讲, partial是一种通过将部分参数应用于现有函数来创建新函数的便捷方法 。functools.partial 允许你创建一个新函数,该函数是现有函数的修改版本。你可以为一个或多个参数指定默认值,这意味着…

    10/06/2025
    0260
  • Pandas平替Polars

    Polars是一个用于操作结构化数据的高性能DataFrame库,可以说是平替pandas最有潜质的包。Polars其核心部分是用Rust编写的,但该库也提供了Python接口。主要特点包括: 快速: Polars是从零开始编写的,紧密与机器结…

    30/05/2025
    0870
  • 大模型算法工程师面试问题汇总

    一、基础理论与数学 深度学习基础:前馈网络、反向传播、梯度消失/爆炸 常见激活函数(ReLU, GeLU, Swish)及其优缺点 损失函数:交叉熵、MSE、对比学习损失(InfoNCE) 优化器原理(Adam, AdamW, LAMB)与超参数调…

    默认分类 27/05/2025
    01220
  • 均方层归一化RMSNorm(均方根标准化)

    一、理论基础 layer normalization 重要的两个部分是平移不变性和缩放不变性。 Root Mean Square Layer Normalization 认为 layer normalization 取得成功重要的是缩放不变性,而不是平移不变性。因此,去除了计算…

    24/05/2025
    01350
  • 【DeepSpeed】3D 并行原理解读

    DeepSpeed 的 3D 并行 是一种高级分布式训练策略,通过结合 数据并行 (Data Parallelism, DP)、模型并行 (Model Parallelism, MP) 和 流水线并行 (Pipeline Parallelism, PP),在多 GPU 和多节点环境中高效训练超大…

    人工智能 21/05/2025
    01740
  • 用 LLM 将非结构化文本转为知识图谱

    核心内容:1. 构建知识图谱的挑战与LLM的解决方案2. 环境配置与关键Python库的安装使用3. 知识图谱的基本概念及其在项目中的应用实例 从非结构化文本中构建知识图谱是一项具有挑战性的任务。它通常需要识别关键术语…

    21/05/2025
    01390
  • 11步骤,使用大语言模型构建知识图谱

    大数据本身蕴藏着丰富价值,但从中挖掘洞见需要耗费大量人力。而知识图谱能够简化这一过程,通过将零散信息整合成结构化、可搜索的形式,能显著提高效率。一项研究表明,使用知识图谱可将数据探索时间最高缩短 70%…

    21/05/2025
    01720
  • Embedding模型微调:基于已有数据快速构建训练与评估数据集

    ? 本文目标 本文主要面向希望在特定领域或任务中提升Embedding模型表现的初学者。希望读完之后,能帮助大家: 准确理解Embedding模型微调的核心概念及其对数据集的依赖。 初步掌握基于已有数据构建高质量微调训练集…

    21/05/2025
    02000
  • Attention Please! MLA、MHA、MQA与GQA原理与代码实现

    多头注意力机制(Multi-Head Attention,MHA) 多头注意力(Multi-Head Attention, MHA)是Transformer模型的核心机制,通过并行计算多个注意力头,使模型能够同时关注输入序列中不同位置的特征。其核心思想是将输…

    20/05/2025
    02130
  • 常用聚类算法

    在机器学习中,无监督学习一直是我们追求的方向,而其中的聚类算法更是发现隐藏数据结构与知识的有效手段。目前如谷歌新闻等很多应用都将聚类算法作为主要的实现手段,它们能利用大量的未标注数据构建强大的主题聚…

    深度学习 20/05/2025
    01430
  • Faiss 索引选择和构建

    # Faiss 索引方法概览 Faiss 索引方法主要分为两大类: ### 精确索引 (Exact Index) : 这类索引方法会遍历所有向量,保证返回最精确的近邻结果。IndexFlatIP 和 IndexFlatL2 就属于精确索引。虽然结果精确,但当数…

    06/05/2025
    02940
  • HF datasets 使用技巧总结

    1. 常用操作:**Sort, shuffle, select, split, shard, rename, remove, cast, and flatten** 2. 结合 map 处理数据3. 不同格式的加载和存储4. 多线程加速处理5. 与pytorch操作示例 # 常用操作 ## 加载 ```python w…

    26/02/2025
    05460
  • DeepSeek超全指南【本地部署、构建知识库、指令技巧、热门客户端】

    Deepseek本地部署方法和构建个人知识库,指令技巧,配合客户端和插件使用。在 Word和WPS中又如何调用Deepseek服务?

    11/02/2025
    018.3K0
Load more posts