数据流模型——【数据科学与工程算法基础】

一、数据流模型

        流动的数据(当作无限的元组序列):总量不限、速率快、无次序、一次性。

        子模型:

        一类按元素作用:时间序列;收银机(前缀和,不断叠加);十字转盘(加入的数据有正有负)。

        二类按元素重要性:界标模型(规定不同数据段重要性);滑动窗口(只考虑窗口元素);衰减窗口(新到重要,旧者重要程度低)。

二、概要数据结构

        保存数据流再查询不可能,需要一种远小于数据流规模的数据结构来查询元素,如直方图、抽样、小波、哈希。

三、近似算法

        既然概要了,就不可能很精确,只能近似估计,近似算法就相当于一种误差的评估。

       (1)∈相对误差

         一个∈代表相对误差,输出值与真值相差小于∈乘以真值。

       (2)∈绝对误差

        一个∈就是一个值,输出值与真值相差小于∈。

       (3)相对误差Plus

        利用切比雪夫不等式将上面两种情况变化:

        1. 输出值与真值相差小于∈乘以真值的概率大于1-x;

        2. 输出值与真值相差小于∈的概率大于1-x。

最近更新

  1. leetcode705-Design HashSet

    2024-04-02 14:28:02       8 阅读
  2. Unity发布webgl之后打开streamingAssets中的html文件

    2024-04-02 14:28:02       8 阅读
  3. vue3、vue2中nextTick源码解析

    2024-04-02 14:28:02       8 阅读
  4. 高级IO——React服务器简单实现

    2024-04-02 14:28:02       8 阅读
  5. 将图片数据转换为张量(Go并发处理)

    2024-04-02 14:28:02       7 阅读
  6. go第三方库go.uber.org介绍

    2024-04-02 14:28:02       8 阅读
  7. 前后端AES对称加密 前端TS 后端Go

    2024-04-02 14:28:02       9 阅读

热门阅读

  1. CPU狂飙900%,该怎么处理

    2024-04-02 14:28:02       3 阅读
  2. 【OpenCV进阶】图像中添加中文字幕

    2024-04-02 14:28:02       6 阅读
  3. 低代码与系统集成:革新企业应用开发的新动力

    2024-04-02 14:28:02       3 阅读
  4. MYSQL08_页的概述、内部结构、行格式

    2024-04-02 14:28:02       5 阅读
  5. 面试中的MVCC到底是什么意思?

    2024-04-02 14:28:02       4 阅读
  6. Spring与SpringMVC常用注解

    2024-04-02 14:28:02       6 阅读
  7. elasticsearch之多条件查询

    2024-04-02 14:28:02       5 阅读
  8. Redis

    Redis

    2024-04-02 14:28:02      3 阅读
  9. 递归---算法

    2024-04-02 14:28:02       6 阅读
  10. 2024最新华为OD机试试题库全 -【符号运算】- C卷

    2024-04-02 14:28:02       4 阅读