机器学习 - 创建多类别的数据

可以用到 scilit-learn 里的 make_blobs() 方法。这个方法用于生成聚类数据集,也用于测试和调试聚类算法。

import torch 
import matplotlib.pyplot as plt 
from sklearn.datasets import make_blobs 
from sklearn.model_selection import train_test_split 

NUM_CLASSES = 4
NUM_FEATURES = 2 
RANDOM_SEED = 42 

# 1. Create multi--class data 
# 返回的结果,第一个元素是一个数组,包含生成的样本点的特征向量。第二个元素是一个数组,包含了每个样本点所属的类别标签
X_blob, y_blob = make_blobs(n_samples = 1000,
                            n_features = NUM_FEATURES,
                            centers = NUM_CLASSES,
                            cluster_std = 1.5,
                            random_state = RANDOM_SEED) 

# 2. Turn data into tensors 
X_blob = torch.from_numpy(X_blob).type(torch.float)
y_blob = torch.from_numpy(y_blob).type(torch.LongTensor)

# 3. Split into train and test sets 
X_blob_train, X_blob_test, y_blob_train, y_blob_test = train_test_split(X_blob, y_blob, test_size = 0.2, random_state = RANDOM_SEED)

# 4. Plot data 
plt.figure(figsize=(10, 7))
plt.scatter(X_blob[:, 0], X_blob[:, 1], c=y_blob, cmap = plt.cm.RdYlBu)

结果如下:
结果如下

点个赞呗~

最近更新

  1. leetcode705-Design HashSet

    2024-04-02 18:20:02       5 阅读
  2. Unity发布webgl之后打开streamingAssets中的html文件

    2024-04-02 18:20:02       5 阅读
  3. vue3、vue2中nextTick源码解析

    2024-04-02 18:20:02       6 阅读
  4. 高级IO——React服务器简单实现

    2024-04-02 18:20:02       5 阅读
  5. 将图片数据转换为张量(Go并发处理)

    2024-04-02 18:20:02       4 阅读
  6. go第三方库go.uber.org介绍

    2024-04-02 18:20:02       6 阅读
  7. 前后端AES对称加密 前端TS 后端Go

    2024-04-02 18:20:02       7 阅读

热门阅读

  1. abc-347

    2024-04-02 18:20:02       4 阅读
  2. Ubuntu 大压缩文件解压工具

    2024-04-02 18:20:02       3 阅读
  3. 生信小白菜之关于mutate函数的一切

    2024-04-02 18:20:02       2 阅读
  4. 什么是App分发?那些分发平台可以选择?

    2024-04-02 18:20:02       2 阅读
  5. Vue tableList:<any>[]介绍

    2024-04-02 18:20:02       2 阅读
  6. python中的浅拷贝和深拷贝

    2024-04-02 18:20:02       5 阅读
  7. go中继承、多态的模拟实现

    2024-04-02 18:20:02       3 阅读
  8. Go build 交叉编译-实现多平台兼容

    2024-04-02 18:20:02       3 阅读
  9. 【无标题】

    2024-04-02 18:20:02       1 阅读
  10. 页面中的图片,以后可不能随便使用了!

    2024-04-02 18:20:02       2 阅读
  11. 常见的两种git工作流分支模型

    2024-04-02 18:20:02       3 阅读
  12. C语言经典面试题目(二十四)

    2024-04-02 18:20:02       3 阅读