读书笔记:机器学习互联网业务安全实践

机器学习互联网业务安全实践,王帅、吴哲夫 著

前言

  • 机器学习发展阶段

    • 规则学习

    • 统计学习

    • 深度学习

  • 机器学习三要素

    • 模型(建模)
    • 策略(学习方法)
    • 算法(实现)
  • 数学基础

    • 数值分析 —— 算法推衍
    • 线性代数 —— 算法实现
    • 概率统计 —— 理解模型
    • 离散数学 —— 理解模型
    • 矩阵论、优化论、泛函分析、贝叶斯统计、模糊数学 —— 理解模型算法的实现原理
  • 如何快速掌握并使用模型,关键在于理解模型的适用条件,从而能构造出模型要求的特征

  • 不一定要选择最合适的模型,理由:

    • 先前的模型转化为适用现有问题的复杂度可能不是很高
    • 对业务场景的深入分析、研究需要大量时间,而这是提取特征的关键
    • 转换模型对结构和工程化的压力大
  • 注重培养看公式比看文字更高效的能力


image-20210520005250228

图:机器学习算法工程师所具备的技能树

第1章 —— 互联网业务简述

  • 业务安全事件的特点
    • 频率高、范围广
    • 高度产业链化
    • 危害严重、社会影响较大
  • 如何应对互联网业务安全挑战?
    • 监控业务安全预警信息—— 先决条件(天时)
      • 业界内的信息共享,对安全事件的联防联控,可以广大公司争取一定的应对时间,避免完全被动
      • 互联网企业可以联合司法机关和政府部分共同治理黑灰产
      • 根据公司业务建立情报监测系统
    • 提升业务安全防护技术 —— 基石(地利)
      • 移动端加固
      • 敏感、隐私信息保护
      • 从海量业务数据中挖掘出异常风险行为
    • 培养业务安全相关的专业技术人员 —— 核心(人和)
      • 专业技能 + 了解业务
  • 该书切入点:基于机器学习技术来打造风险识别引擎,为业务安全对抗提供技术支撑