博客專欄

EEPW首頁 > 博客 > Python 的一萬種用法：生成字符視頻

Python 的一萬種用法：生成字符視頻

發布人：AI科技大本營時間：2021-05-25 來源：工程師

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

發布文章

以下文章來源于新建文件夾X ，作者ZackSock

前言

在之前也寫過生成字符視頻的文章，但是使用的是命令行窗口輸出，效果不是很好，而且存在卡頓的情況。于是我打算直接生成一個mp4的字符視頻。大致思路和之前一樣：Python20行代碼實現視頻字符化。

下面來看一個效果圖：

卡卡西vs帶土效果截取

OpenCV的操作圖像

我們先來看一些基本操作。首先我們需要安裝OpenCV，執行下面語句：

pip install opencv-python

之后就可以使用了。

1.1、讀取和顯示

我們直接看代碼：

import cv2
# 讀取圖片
img = cv2.imread("1.jpg")
# 顯示圖片
cv2.imshow("img", img)
cv2.waitKey()
cv2.destroyAllWindows()

其中waitKey是等待輸入的函數，因為imshow之后顯示一瞬間，所以我們需要調用它。而destroyAllWindows是釋放窗口。

1.2、灰度轉換

灰度轉換就是將圖片轉換成黑白圖片（灰色），這樣可以方便我們處理像素。代碼如下：

import cv2
img = cv2.imread("1.jpg")
# 灰度轉換
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

我們還可以直接以灰度形式讀入：

import cv2
# 以灰度形式讀入
img = cv2.imread("1.jpg", 0)

1.3、獲取圖片尺寸并修改尺寸

我們直接看代碼：

import cv2
img = cv2.imread("1.jpg", 0)
# 獲取圖片的高寬
h, w = img.shape
# 縮放圖片
res = cv2.resize(img, (w//2, h//2))

因為img的shape屬性是一個元組，所以我們可以直接自動拆包。

然后調用cv2.resize函數，第一個參數傳入圖片，第二個參數傳入修改后的尺寸。

1.4、繪制文字

繪制文字我們需要調用cv2.putText函數，代碼如下：

import cv2
img = cv2.imread('1.jpg')
# 繪制文字
cv2.putText(
    # 被繪制的圖片
    img, 
    # 要繪制的文字
    'Hello',
    # 文字左下角的坐標
    (100, 500),
    # 字體
    cv2.FONT_HERSHEY_SIMPLEX,
    # 字體大小縮放
    20, 
    # 文字顏色
    (0, 0, 0),
    # 文字粗細
    10
)

我們只需要注意這些參數就好了。

1.5、讀取視頻

讀取視頻的操作一般是通用的，代碼如下：

import cv2
# 讀取視頻
cap = cv2.VideoCapture('1.mp4')
# 獲取視頻的幀率
fps = cap.get(cv2.CAP_PROP_FPS)
# 循環讀取圖片的每一幀
while True:
    # 讀取下一幀
    ret, frame = cap.read()
    if not ret:
        break
    else:
        pass
cap.release()

上面我們獲取的視頻的幀，在寫入視頻的時候我們需要用到。

1.6、寫入視頻

寫入視頻的操作也是常規代碼：

import cv2
fourcc = cv2.VideoWriter_fourcc(*'mp4v')
writer = cv2.VideoWriter('11.mp4', fourcc, fps, (w, h))
# 寫入視頻
writer.write(frame)
***
write.release()

有了這些知識，我們就可以開始下一步工作了。

像素映射成字符

對于只有一個通道的圖片，我們可以把它當成一個矩形，這個矩形最小單位就是一個像素。而字符化的過程就是用字符替代像素點的過程。所以我們要遍歷圖像的每個像素點，但是我們應該用什么字符取代呢？

我們顏色有一個參照表，而opencv將這個參數表切割成256份，代表不同的程度，我們也可以做一個參照表，不過表中的內容不是顏色，而是字符。

顏色表

上圖為顏色表，我們可以使顏色表和字符表建立映射關系。假如字符表如下：

mqpka89045321@#$%^&*()_=||||}

我們可以得到下列公式：

字符和顏色之間等式

經過變換可以求得相應顏色對應字符表中的字符：

計算字符下標的公式

這個公式不理解也沒關系，只需要會用即可。下面就是我們像素轉字符的代碼：

def pixel2char(pixel):
    char_list = "@#$%&erytuioplkszxcv=+---.     "
    index = int(pixel / 256 * len(char_list))
    return char_list[index]

這個字符表是可以自己定義的。

生成字符圖片

現在我們只需要將像素逐個轉換成字符就好了，代碼如下：

def get_char_img(img, scale=4, font_size=5):
    # 調整圖片大小
    h, w = img.shape
    re_im = cv2.resize(img, (w//scale, h//scale))
    # 創建一張圖片用來填充字符
    char_img = np.ones((h//scale*font_size, w//scale*font_size), dtype=np.uint8)*255
    font = cv2.FONT_HERSHEY_SIMPLEX
    # 遍歷圖片像素
    for y in range(0, re_im.shape[0]):
        for x in range(0, re_im.shape[1]):
            char_pixel = pixel2char(re_im[y][x])
            cv2.putText(char_img, char_pixel, (x*font_size, y*font_size), font, 0.5, (0, 0, 0))
    return char_img

這里我們使用了一個np.ones函數，它的作用我們理解為生成一個黑色圖片。

生成的尺寸我們先除了scale，然后再乘font_size。scale是原圖的縮小程度，因為像素有很多，所以我們需要先把圖片縮小。而為了讓我們的字體顯示更清楚，我們需要把生成的字符圖片放大。

因此需要注意，雖然我們生成的圖片看起來單調，但是當font_size設置為5時，得到的圖片已經比較大了。因此當你生成長時間的視頻時，會花費比較多的時間，生成的視頻也比較大。

我們來測試一下上面的函數：

import cv2
import numpy as np
def pixel2char(pixel):
    char_list = "@#$%&erytuioplkszxcv=+---.     "
    index = int(pixel / 256 * len(char_list))
    return char_list[index]
def get_char_img(img, scale=4, font_size=5):
    # 調整圖片大小
    h, w = img.shape
    re_im = cv2.resize(img, (w//scale, h//scale))
    # 創建一張圖片用來填充字符
    char_img = np.ones((h//scale*font_size, w//scale*font_size), dtype=np.uint8)*255
    font = cv2.FONT_HERSHEY_SIMPLEX
    # 遍歷圖片像素
    for y in range(0, re_im.shape[0]):
        for x in range(0, re_im.shape[1]):
            char_pixel = pixel2char(re_im[y][x])
            cv2.putText(char_img, char_pixel, (x*font_size, y*font_size), font, 0.5, (0, 0, 0))
    return char_img
if __name__ == '__main__':
    img = cv2.imread('dl.jpg', 0)
    res = get_char_img(img)
    cv2.imwrite('d.jpg', res)

效果如下：

生成的字符畫

可以看到效果還是很不錯的。

生成字符視頻

有了上面的代碼，我們就可以對整個視頻進行轉換了。將視頻轉換成字符視頻的代碼如下：

def generate(input_video, output_video):
    # 1、讀取視頻
    cap = cv2.VideoCapture(input_video)
    # 2、獲取視頻幀率
    fps = cap.get(cv2.CAP_PROP_FPS)
    # 讀取第一幀，獲取轉換成字符后的圖片的尺寸
    ret, frame = cap.read()
    char_img = get_char_img(cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY), 4)
    # 創建一個VideoWriter，用于保存視頻
    fourcc = cv2.VideoWriter_fourcc(*'mp4v')
    writer = cv2.VideoWriter(output_video, fourcc, fps, (char_img.shape[1], char_img.shape[0]))
    while ret:
        # 讀取視頻的當前幀，如果沒有則跳出循環
        ret, frame = cap.read()
        if not ret:
            break
        # 將當前幀轉換成字符圖
        gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        char_img = get_char_img(gray, 4)
        # 轉換成BGR模式，便于寫入視頻
        char_img = cv2.cvtColor(char_img, cv2.COLOR_GRAY2BGR)
        writer.write(char_img)
    writer.release()

下面是卡卡西經典戰役的字符視頻片段：

卡卡西vs帶土效果

完整代碼如下：

import cv2
import numpy as np
def pixel2char(pixel):
    char_list = "@#$%&erytuioplkszxcv=+---.     "
    index = int(pixel / 256 * len(char_list))
    return char_list[index]
def get_char_img(img, scale=4, font_size=5):
    # 調整圖片大小
    h, w = img.shape
    re_im = cv2.resize(img, (w//scale, h//scale))
    # 創建一張圖片用來填充字符
    char_img = np.ones((h//scale*font_size, w//scale*font_size), dtype=np.uint8)*255
    font = cv2.FONT_HERSHEY_SIMPLEX
    # 遍歷圖片像素
    for y in range(0, re_im.shape[0]):
        for x in range(0, re_im.shape[1]):
            char_pixel = pixel2char(re_im[y][x])
            cv2.putText(char_img, char_pixel, (x*font_size, y*font_size), font, 0.5, (0, 0, 0))
    return char_img
def generate(input_video, output_video):
    # 1、讀取視頻
    cap = cv2.VideoCapture(input_video)
    # 2、獲取視頻幀率
    fps = cap.get(cv2.CAP_PROP_FPS)
    # 讀取第一幀，獲取轉換成字符后的圖片的尺寸
    ret, frame = cap.read()
    char_img = get_char_img(cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY), 4)
    # 創建一個VideoWriter，用于保存視頻
    fourcc = cv2.VideoWriter_fourcc(*'mp4v')
    writer = cv2.VideoWriter(output_video, fourcc, fps, (char_img.shape[1], char_img.shape[0]))
    while ret:
        # 讀取視頻的當前幀，如果沒有則跳出循環
        ret, frame = cap.read()
        if not ret:
            break
        # 將當前幀轉換成字符圖
        gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        char_img = get_char_img(gray, 4)
        # 轉換成BGR模式，便于寫入視頻
        char_img = cv2.cvtColor(char_img, cv2.COLOR_GRAY2BGR)
        writer.write(char_img)
    writer.release()
if __name__ == '__main__':
    generate('in.mp4', 'out.mp4')

我們只需要修改generate的參數就好了。

*博客內容為網友個人發布，僅代表博主個人觀點，如有侵權請聯系工作人員刪除。

霍爾傳感器相關文章:霍爾傳感器工作原理

霍爾傳感器相關文章:霍爾傳感器原理

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： Python

焦點

更多>>

技術專區

關閉

博客專欄

Python 的一萬種用法：生成字符視頻

相關推薦

技術專區