• SQL语句以及在Python中的应用

    本文记录一些自己使用过的SQL语句,以及在Python中的应用。

  • Python处理Excel表格之列转行

    用 Python处理Excel中的数据,把以下图片中的图一转到下面图二的形式:

    就是一个列转到行。

    解决思路:

    • 1.用Pandas库读取表格中的数据;
    • 2.把读取出来的数据处理下,形成列转到行;
    • 3.再把数据写入一个新的Excel表格。
  • Win11安装Hyper-V脚本

    笔记本装的是win11家庭版,没有装Hyper-V。因为想装Docker Desktop,偶尔测试用,所以就把 Hyper-V装起来试一下。

  • Python3.8安装turle库报错

    这个应该是Python低版本都会碰到的错误,我用的Python3.8.6就报错了,比这个低的版本可能都会有这个错误。

    报错信息如下:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    # 运行 pip install turtle
    Collecting turtle
    Downloading' turtle-0.0.2. tar. gz (11,kB) Preparing metadata (setup.py)
    error. error: subprocess-exited-with-error.
    X python setup.py egg info did not run successfully. exit code:1
    '[7 lines'of output]
    Traceback (most recent call last): File “<string>", line.36,| in <module>
    File “<pip=setuptools-caller>", line 34, in'<module>
    File "C:\Users\wq\AppData\Local\Temp\pip-install'-vq_spolw\turtle_0870ca33270d4fe9b738a5def2756154\setup.py",line:40
    except ValueError",ve: SyntaxError: invalid syntax [end of output]
    U 20
    note: This error originates from a subprocess, and is liķely not a problem with pip.
  • 开源Linux服务器运维管理面板1Panel

    1Panel 是一个开源的 Linux 服务器运维管理面板。

    安装很方便,运行一条命令就安装好了。

    原来一直没用面板,主要就是都用的Docker,所以也不用看什么,基本上命令就够用了。

    不过随着Docker中的容器越来越多,先是装了个 LazyDocker 来看。突然看到这个开源的管理面板工具,就试了下。感觉还不错。

  • Python中关于小数四舍五入的方法

    在Python中,我们经常需要对小数进行四舍五入操作。四舍五入是一种常见的数值处理方式,可以将小数精确到指定的位数。Python提供了多种方法来实现小数的四舍五入操作。

  • Python找出一堆按递增的文件中缺少的序号

    原因是这样的:

    用手机拍了四五百张照片后,用苹果手机连接电脑,想导入到电脑里。

    然后发现了这个问题:连接电脑后,在电脑上看到了像U盘盘符的Apple盘符,打开后发现照片不全;如果在手机相册中打开某张没有的照片,再在电脑中打开就能看到这张照片,不知道什么bug,感觉是没加载全的。

    为了快速找到到底缺了哪些照片,因为图片文件名都是按序号递增的,就想用到Python直接检查一下好了。毕竟少了好几十张,手动找起来真的麻烦死了。

  • Python使用pytesseract库进行文字识别

    pytesseract是Python的一个OCR文本识别库。

    以下几点概括了它的主要信息:

    • 基于Tesseract OCR引擎:pytesseract是Tesseract OCR引擎的Python接口,需要先安装Tesseract。
    • 支持多种语言:通过Tesseract训练好的语言数据,pytesseract支持英文、中文等多种语言的OCR识别。
    • 主要功能:主要提供 image_to_string等方法,将图像文件识别为文本内容。
    • 准确率:基于深度学习的Tesseract 4.0+,识别准确率可以达到96%以上。
    • 使用简单:只需要几行代码就可以实现OCR识别,非常易于上手。
    • 识别流程:加载图像-> 预处理(提高识别质量) -> OCR识别 -> 后处理文本
    • 适用场景:printed文本识别、 invoices识别、身份证/护照识别等。
    • 优势:开源、使用简单、支持多语言、支持训练自定义模型。
    • 劣势:对手写体识别效果较差,对图像质量要求较高。
    • 备选方案:EasyOCR、PaddleOCR等其他OCR库。

    Github项目地址:https://github.com/tesseract-ocr/tesseract

  • Python使用Easyocr库进行文字识别

    EasyOCR是一个开源的Python库,用于进行光学字符识别(OCR)。

    它的主要特点包括:

    • 简单易用:只需要几行代码就可以实现OCR,非常容易上手。
    • 支持多种语言:英语、中文、日语等80多种语言都支持。
    • 准确率高:基于深度学习的算法,识别准确率高。
    • 训练自定义模型:支持使用自己的数据集训练自定义OCR模型。
    • 支持检测方向:可以自动检测图像文字方向。
    • 支持多语言混合:可以处理多国语言混合的图像。
    • 基于PyTorch:建立在PyTorch深度学习框架之上。

    由于易用性强、准确率高等优,EasyOCR非常适合用于快速实现OCR功能,或者作为OCR项目的基础库。它可以广泛应用于票据识别、车牌识别、身份证识别等领域。

    Github项目地址:https://github.com/JaidedAI/EasyOCR

  • Linux 校准系统时间方法

    手上的行空板里的Linux(Debian)系统中,系统时间不对,所以看一下怎么校准方便。

    校正Linux系统时间有多种方法,可以通过手动设置时间、使用NTP服务器同步时间等方式来实现。