论文阅读U-KAN Makes Strong Backbone for MedicalImage Segmentation and Generation

2024-06-12 00:04:05
开发
20

作为一种非常有潜力的代替MLP的模型，KAN最终获得了学术界极大的关注。在我昨天的博客里，解读了最近的热门模型KAN：

论文阅读KAN: Kolmogorov–Arnold Networks-CSDN博客

KAN的原文作者提到了很多不足。本文算是对其中两个现有不足的回应，也就是:1)KAN不仅只能用于特定结构和深度，2）KAN不仅能用于小规模AI+Science任务，还可以用于更大规模或更复杂的任务。

本文将KAN融入了U-Net网络结构中，并运用在医学图像分割任务上。

1，U-KAN架构

整体结构如图，是个U-Net经典的对称编解码器结构。编解码器都有卷积部分和token化KAN模块部分组成。卷积部分如U-Net一样，不赘述。

Token化的KAN模块：

1）token化：首先对特征进行重塑，得到一系列扁平化的二维patch。接着进行线性投影，线性投影是通过一个核大小为3的卷积层实现的。卷积层足以编码位置信息，并且其性能实际上优于标准的位置编码技术。

2）KAN块：在获取到token之后，我们将它们传入一系列的KAN层（N=3）。在每个KAN层之后，特征会通过一个高效的深度卷积层（DwConv）、一个批量归一化层（BN）和一个ReLU激活函数。此外，还是用了残差连接。

2，消融实验

1）KAN层层数影响

2）KAN层换成MLP的话，结果会下降（在我看来本文最重要的结论也就是这个）

3）模型规模的影响

3，与SOTA对比

4，本文的缺陷与不足

本文在我看来有两个主要不足：

1）训练难度：KAN至关重要的训练难度问题没有提及。将KAN结构嵌入U-Net是否会导致训练变得不稳定或难以收敛呢？训练速度会慢多少呢？

2）实验对比不充分，结果可能不SOTA：

本文的对比实验，完全没有对比基于Transformer的图像分割模型，对比的几个模型要么是纯卷积模型，要么是卷积+MLP模型。那么我们是否可以认为U-KAN的结果逊于主流的Transformer分割模型？

5总结

在我看来，虽然本文模型大概率并不SOTA，但是也不是非要SOTA的模型和实验才有价值。

本文的价值在于验证了KAN可以用于更广泛的数据集，并且在更多场景下展现了超越和取代MLP的潜力。

原文地址:https://blog.csdn.net/wwimhere/article/details/139607325 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1800559636462571520.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

【论文阅读】FreeU: Free Lunch in Diffusion U-Net

2024-06-12 00:04:05 47 阅读
论文阅读 Attention is all u need - transformer

2024-06-12 00:04:05 41 阅读
论文阅读U-KAN Makes Strong Backbone for MedicalImage Segmentation and Generation

2024-06-12 00:04:05 21 阅读
【论文阅读】

2024-06-12 00:04:05 29 阅读
论文阅读：Vary论文阅读笔记

2024-06-12 00:04:05 41 阅读
论文阅读：Vary-toy论文阅读笔记

2024-06-12 00:04:05 60 阅读
【论文阅读笔记】清单

2024-06-12 00:04:05 55 阅读
《PFL》论文阅读笔记

2024-06-12 00:04:05 61 阅读
gpt阅读论文利器

2024-06-12 00:04:05 44 阅读
SimCSE论文阅读

2024-06-12 00:04:05 47 阅读

最近更新

题解 - 序列

2024-06-12 00:04:05 5 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-06-12 00:04:05 5 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-06-12 00:04:05 5 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-06-12 00:04:05 5 阅读
NoSQL之Redis非关系型数据库

2024-06-12 00:04:05 6 阅读
2024.7.22 作业

2024-06-12 00:04:05 6 阅读
GDB调试正在运行的程序

2024-06-12 00:04:05 3 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-06-12 00:04:05 4 阅读
在Django里面运行非项目文件

2024-06-12 00:04:05 4 阅读
SSD基本架构与工作原理

2024-06-12 00:04:05 4 阅读
在誉天学习完HCIE就业吗？

2024-06-12 00:04:05 6 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-06-12 00:04:05 3 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-06-12 00:04:05 4 阅读
go 协程池的实现

2024-06-12 00:04:05 3 阅读
Shell脚本循环语句与函数

2024-06-12 00:04:05 4 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-06-12 00:04:05 5 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-06-12 00:04:05 5 阅读
四大引用——强软弱虚

2024-06-12 00:04:05 4 阅读
Python语言-面向对象

2024-06-12 00:04:05 6 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-06-12 00:04:05 5 阅读
网站安全-CDN篇

2024-06-12 00:04:05 5 阅读