前言

学习一下在Windows上搞搞简单的图像识别,由于我的Pycharm环境下有venv独立环境,就不整虚拟环境了。


环境搭建

cuda

据说GPU计算比CPU快,为了用GPU训练模型,需要按照显卡信息找到支持的CUDA版本,在powershell中输入命令:

nvidia-smi

看到我的显卡支持的CUDA最高为12.0:

再到nvidia网站上找到对应版本的CUDA下载安装。

默认安装,安装到C盘,装完之后看了一眼,占了几个G,也不大。

在powershell中输入命令:

nvcc -V

看到按照完成:

pytorch

官方网站上找到安装命令,不过这里没有适合CUDA 12.0版本的,所以安装的CUDA 11.8:

命令:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

然后等待安装完成。

ultralytics

pip install ultralytics

yolov8

Github上下载yolov8源码,根据参考文章,v8.1.0比较稳定。

下载之后解压,在Github找到权重文件yolov8n.pt,再弄一张测试用图片放到项目根目录,再将整个yolov8源代码目录放到Pycharm项目里面,然后用Pycharm打开。

用一个简单的python脚本测试环境:

# -*- coding:utf8 -*-

from ultralytics import YOLO

model = YOLO("./ultralytics-8.1.0/yolov8n.pt")
source = "./ultralytics-8.1.0/cat.jpg"
model.predict(source, save=True, imgsz=640, conf=0.2)

运行耗时挺短的,结果:

image 1/1 D:\Genshin\ultralytics-8.1.0\cat.jpg: 416x640 1 cat, 115.5ms
Speed: 3.0ms preprocess, 115.5ms inference, 1.0ms postprocess per image at shape (1, 3, 416, 640)
Results saved to runs\detect\predict2

在目录下找到结果图片:


参考

深度学习目标检测:yolov8(Ultralytics)环境配置,适合0基础小白,超详细


Python 机器学习

本博客所有文章除特别声明外,均采用 CC BY-SA 3.0协议 。转载请注明出处!

yolov10入门
tai-e学习(2)