数据流模型——【数据科学与工程算法基础】

一、数据流模型

        流动的数据(当作无限的元组序列):总量不限、速率快、无次序、一次性。

        子模型:

        一类按元素作用:时间序列;收银机(前缀和,不断叠加);十字转盘(加入的数据有正有负)。

        二类按元素重要性:界标模型(规定不同数据段重要性);滑动窗口(只考虑窗口元素);衰减窗口(新到重要,旧者重要程度低)。

二、概要数据结构

        保存数据流再查询不可能,需要一种远小于数据流规模的数据结构来查询元素,如直方图、抽样、小波、哈希。

三、近似算法

        既然概要了,就不可能很精确,只能近似估计,近似算法就相当于一种误差的评估。

       (1)∈相对误差

         一个∈代表相对误差,输出值与真值相差小于∈乘以真值。

       (2)∈绝对误差

        一个∈就是一个值,输出值与真值相差小于∈。

       (3)相对误差Plus

        利用切比雪夫不等式将上面两种情况变化:

        1. 输出值与真值相差小于∈乘以真值的概率大于1-x;

        2. 输出值与真值相差小于∈的概率大于1-x。

相关推荐

  1. 数据流模型——【数据科学工程算法基础

    2024-04-02 14:28:02       46 阅读
  2. 数据结构算法 | 基础篇】环形数组模拟队列

    2024-04-02 14:28:02       47 阅读
  3. 数据结构算法 | 基础篇】数组模拟

    2024-04-02 14:28:02       43 阅读
  4. 数据科学实战:掌握核心数据提取技巧工具

    2024-04-02 14:28:02       40 阅读
  5. Python数据科学工具大全

    2024-04-02 14:28:02       54 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-02 14:28:02       171 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-02 14:28:02       189 阅读
  3. 在Django里面运行非项目文件

    2024-04-02 14:28:02       157 阅读
  4. Python语言-面向对象

    2024-04-02 14:28:02       170 阅读

热门阅读

  1. CPU狂飙900%,该怎么处理

    2024-04-02 14:28:02       44 阅读
  2. 【OpenCV进阶】图像中添加中文字幕

    2024-04-02 14:28:02       48 阅读
  3. 低代码与系统集成:革新企业应用开发的新动力

    2024-04-02 14:28:02       46 阅读
  4. MYSQL08_页的概述、内部结构、行格式

    2024-04-02 14:28:02       49 阅读
  5. 面试中的MVCC到底是什么意思?

    2024-04-02 14:28:02       51 阅读
  6. Spring与SpringMVC常用注解

    2024-04-02 14:28:02       42 阅读
  7. elasticsearch之多条件查询

    2024-04-02 14:28:02       46 阅读
  8. Redis

    Redis

    2024-04-02 14:28:02      43 阅读
  9. 递归---算法

    2024-04-02 14:28:02       50 阅读
  10. 2024最新华为OD机试试题库全 -【符号运算】- C卷

    2024-04-02 14:28:02       41 阅读