数据流模型——【数据科学与工程算法基础】

一、数据流模型

        流动的数据(当作无限的元组序列):总量不限、速率快、无次序、一次性。

        子模型:

        一类按元素作用:时间序列;收银机(前缀和,不断叠加);十字转盘(加入的数据有正有负)。

        二类按元素重要性:界标模型(规定不同数据段重要性);滑动窗口(只考虑窗口元素);衰减窗口(新到重要,旧者重要程度低)。

二、概要数据结构

        保存数据流再查询不可能,需要一种远小于数据流规模的数据结构来查询元素,如直方图、抽样、小波、哈希。

三、近似算法

        既然概要了,就不可能很精确,只能近似估计,近似算法就相当于一种误差的评估。

       (1)∈相对误差

         一个∈代表相对误差,输出值与真值相差小于∈乘以真值。

       (2)∈绝对误差

        一个∈就是一个值,输出值与真值相差小于∈。

       (3)相对误差Plus

        利用切比雪夫不等式将上面两种情况变化:

        1. 输出值与真值相差小于∈乘以真值的概率大于1-x;

        2. 输出值与真值相差小于∈的概率大于1-x。

相关推荐

  1. 数据流模型——【数据科学工程算法基础

    2024-04-02 14:28:02       23 阅读
  2. 数据结构算法 | 基础篇】环形数组模拟队列

    2024-04-02 14:28:02       18 阅读
  3. 数据结构算法 | 基础篇】数组模拟

    2024-04-02 14:28:02       16 阅读
  4. 数据科学实战:掌握核心数据提取技巧工具

    2024-04-02 14:28:02       14 阅读
  5. Python数据科学工具大全

    2024-04-02 14:28:02       35 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-02 14:28:02       5 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-02 14:28:02       5 阅读
  3. 在Django里面运行非项目文件

    2024-04-02 14:28:02       4 阅读
  4. Python语言-面向对象

    2024-04-02 14:28:02       6 阅读

热门阅读

  1. CPU狂飙900%,该怎么处理

    2024-04-02 14:28:02       20 阅读
  2. 【OpenCV进阶】图像中添加中文字幕

    2024-04-02 14:28:02       23 阅读
  3. 低代码与系统集成:革新企业应用开发的新动力

    2024-04-02 14:28:02       22 阅读
  4. MYSQL08_页的概述、内部结构、行格式

    2024-04-02 14:28:02       25 阅读
  5. 面试中的MVCC到底是什么意思?

    2024-04-02 14:28:02       25 阅读
  6. Spring与SpringMVC常用注解

    2024-04-02 14:28:02       24 阅读
  7. elasticsearch之多条件查询

    2024-04-02 14:28:02       24 阅读
  8. Redis

    Redis

    2024-04-02 14:28:02      21 阅读
  9. 递归---算法

    2024-04-02 14:28:02       26 阅读
  10. 2024最新华为OD机试试题库全 -【符号运算】- C卷

    2024-04-02 14:28:02       22 阅读