SpacemiT AI Demo 示例库
简介
SpacemiT AI Demo 示例库是基于进迭时空 K 系列芯片适配的 AI 应用示例集合。该项目为开发者提供了丰富的 AI 模型部署教程和完整的示例代码,涵盖了计算机视觉(CV)、自然语言处理(NLP)、语音处理等多个 AI 领域。
源码仓库: https://gitee.com/bianbu/spacemit-demo.git
项目特点
- 开箱即用: 提供完整的模型下载、量化、部署流程
- 多语言支持: 同时提供 Python 和 C++ 版本的示例代码
- 性能优化: 针对 SpacemiT K1 芯片深度优化,提供详细的性能数据
- 完整文档: 每个示例都包含详细的 README 文档和使用说明
目录结构
spacemit_demo/
├── examples/
│ ├── CV/ # 计算机视觉示例
│ │ ├── yolov5/ # 目标检测模型
│ │ ├── yolov6/ # 目标检测模型
│ │ ├── yolov8/ # 目标检测模型
│ │ ├── yolov8-pose/ # 姿态检测模型
│ │ ├── yolov11/ # 目标检测模型
│ │ ├── yolov5-face/ # 人脸检测模型
│ │ ├── yolo-world/ # 开放词汇检测模型
│ │ ├── resnet/ # 图像分类模型
│ │ ├── efficientnet/ # 图像分类模型
│ │ ├── mobilenet_v2/ # 轻量级分类模型
│ │ ├── inception_v1/ # 图像分类模型
│ │ ├── inception_v3/ # 图像分类模型
│ │ ├── swin-tiny_16xb64_in1k/ # 视觉 Transformer 模型
│ │ ├── fcn/ # 语义分割模型
│ │ ├── unet/ # 语义分割模型
│ │ ├── SAM/ # 图像分割模型
│ │ ├── arcface/ # 人脸识别模型
│ │ ├── nanotrack/ # 目标跟踪模型
│ │ └── CLIP/ # 多模态模型
│ └── NLP/ # 自然语言处理示例
│ ├── spacemit_asr/ # 语音识别模块
│ ├── spacemit_llm/ # 大语言模型模块
│ ├── spacemit_tts/ # 文本转语音模块
│ ├── spacemit_audio/ # 音频处理模块
│ └── *.py # 各种 AI 功能演示脚本
└── README.md # 项目总览
示例分类
计算机视觉 (CV)
计算机视觉模块包含了主流的 CV 模型示例,涵盖图像分类、目标检测、语义分割、人脸识别等任务:
图像分类
- ResNet50: 经典的深度残差网络,适用于图像分类任务
- EfficientNet: 高效的卷积神经网络,在精度和效率间取得良好平衡
- MobileNetv2: 专为移动设备优化的轻量级网络
- Inception: Google 提出的多尺度特征提取网络
- Swin Transformer: 基于窗口注意力的视觉 Transformer
目标检测
- YOLOv5/v8/v11: 最新的 YOLO 系列目标检测算法
- YOLOv6: 美团提出的高效目标检测算法
- YOLOv8-pose: 基于 YOLOv8 的人体姿态检测模型
- YOLO-World: 支持开放词汇的目标检测模型
语义分割
- FCN: 全卷积网络,语义分割的经典方法
- U-Net: 医学图像分割领域的经典网络
- SAM: Meta 提出的分割一切模型
人脸相关
- ArcFace: 基于角度边际的人脸识别算法
- YOLOv5-face: 专门用于人脸检测的 YOLO 变体
其他
- NanoTrack: 轻量级目标跟踪算法
- CLIP: OpenAI 的图文多模态理解模型