0 引 言
隨著物聯網概念的基于提出和技術的發展,及人們對于物聯 網的物聯網熱衷和市場的走向,各類智能產品已慢慢占據了日常家居 產品市場,基于豐富了人們對于智能產品的物聯網選擇 [1]。越來越多的基于貼 近生活的智能產品正在涌現,將云計算技術應用于智能家居產 品設計中,也是物聯網技術深入居民日常生活的印證 [2]。本文 設計與實現的智能云鏡系統正是順應以上趨勢把科技融入生 活的樣品,高度體現了科技以人為本的理念。
1 硬件設計
1.1 微處理器
系統微處理器選擇 64 位四核 ARM Cortex-A53 處理 器系列的 BCM2837 芯片。該處理器是 ARMv8 架構 ARM Cortex-A50 系列產品,其可擴展性使 ARM 的合作伙伴能夠針 對智能手機、高性能服務器等各類不同市場需求開發系統級 芯片。Cortex-A53 處理器不僅是功耗效率最高的 ARM 應用 處理器,也是全球最小的 64 位處理器。能夠支持所有最新的 ARM GNU/Linux,支持各類音頻、視頻和以太網接口等。
1.2 LCD 顯示屏
7 英 寸 通 用 LCD 電 容 式 觸 摸 顯 示 屏 分 辨 率 可 達 800×480,可支持常用的系統鏡像,如 Raspberry Pi,Banana Pi 和 Banana Pro 等。另外,該顯示屏支持背光控制,更節省 電能。本系統的設計與實現采用靜態加載對 LCD 屏驅動的支 持,需要在 Linux 內核編譯時進行配置。選中設備驅動選項 “Device Drivers ->”進入設備驅動配置界面,選中“Graphics support”進入圖形支持選項。進入“Support for frame buffer devices”配置界面選擇“LCD init in kernel”選項加入內核編 譯就可使內核實現對 LCD 屏驅動的支持,為系統顯示設備提 供編程接口。LCD 驅動配置界面如圖 1 所示。
1.3 原子鏡
原子鏡又稱單向玻璃或單面鏡,是一種對可見光具有高 反射比的玻璃。透過玻璃的觀察面可以清晰觀察另一側,而 在玻璃的被觀察面只能看到反射的鏡像。原子鏡之所以能產 生以上單面反光的效果,是因為鏡的兩面處于不同光度的環 境。本系統利用 LCD 屏幕和原子鏡的疊加實現“智能云鏡” 的外觀顯示。
1.4 WiFi 模塊
ESP8266 芯片可實現串口轉 WiFi 功能,ESP8266 是一 款超低耗通用非同步 WiFi 數據收發器,內置 TCP/IP 協議棧, 支持多路 TCP Client 連接。支持豐富的 Socket AT 指令,透 傳時的數據最大傳輸速率為 460 800 bit/s,傳輸可靠性好。本 系統利用該 WiFi 模塊實現網絡服務,利用互聯網上傳或接收 信息。
1.5 LM393 雙電壓比較器
LM393 是雙電壓比較器集成電路。輸出負載電阻能銜接 在可允許電源電壓范圍內的任何電源電壓上,不受 Vcc 端電壓值的限制。此輸出能作為一個簡單的對地 SPS 開路(當不用負 載電阻沒被運用),輸出部分的陷電流被可能得到的驅動和器 件的 β 值所限制。當達到極限電流(16 mA)時,輸出晶體管 將退出且輸出電壓將很快上升。本系統利用比較器確認啟用錄 音功能的時間,當用戶發出的聲音超過指定分貝時即表示向系 統發出語音命令。 本系統還使用了 LM386 功模塊、麥克風、紅外傳感 器和繼電器等硬件設備。
2 軟件設計
本系統是一款基于物聯網技術,利用云平臺實現的人機 交互智能云鏡系統,摒棄了傳統鏡子功能的單一性。設計方 案基于 WiFi 無線通信技術實現物聯網聯動,開發了 GUI 客戶 端程序。用戶可根據個人的生活習慣或喜好,在照鏡子的同時 和鏡子交流。系統內置了感知組件,可根據用戶的語音和手勢 動作完成指令控制操作。例如,向它提出各種問題,獲得日期、 天氣、新聞、菜譜等常用信息 ;讓它像朋友一樣聊天、講笑話 等。系統還包含了音樂播放和燈光控制功能,利用語音識別等 方式進行控制,實現了一物多用。本系統選擇 Linux 操作系統 作為開發環境,結合百度語音云和圖靈機器人開發實現。
2.1 百度語音云
語音識別是指與機器進行語音交流,讓機器明白你說什 么。中國物聯網校企聯盟形象地把語音識別比作為“機器的聽 覺系統”。語音識別技術就是讓機器通過識別和理解過程把語 音信號轉變為相應的文本或命令的高技術 [3]。語音合成是通 過機械、電子方法產生人造語音的技術。TTS 技術(又稱文 語轉換技術)隸屬于語音合成,它是將計算機自己產生的、或 外部輸入的文字信息轉變為可以聽得懂、流利的漢語口語輸出 技術 [4]。
百度語音是語音技術、自然語言處理、智能搜索三方面 的完美融合。以更自然的交互方式對用戶所說語言進行更準確 地識別,只有對用戶需求準確理解,才能為用戶提供更滿意的 結果。系統集成語音識別、語義理解、深度問答、知識推理、 多輪對話、智能摘要、情感分析、語言生成、語音合成等功能, 能夠滿足用戶的多種復雜需求。
2.2 圖靈機器人
圖靈機器人是在人工智能的核心能力基礎上為開發人員 提供云計算和大數據平臺的在線服務和開發接口,提供機器 人和人的文字交互,實現前端業務邏輯的自定義 [5]。圖靈機器 人能用準確、簡潔的自然語言回答用戶用自然語言提出的問題, 以方便人們快速、準確地獲取信息。隨著技術的進步,問答 機器人目前已能夠處理常識性、開放性問題及聊天問候等。問 答機器人能夠給用戶提供非常智能化和人性化的服務,為用戶 帶來極大方便和美好體驗。
在本系統中可實現機器人昵稱、性別、年齡等身份屬性 設置,同時在自有平臺或產品上完成知識庫的新增、刪減、更 改編輯以及批量導入等操作。此外還能夠為每一位使用者分配 一個獨立機器人。主要涉及的功能包括聊天對話、問答百科、 生活百科、知識庫、新聞資訊、成語接龍、故事大全、菜譜大 全、笑話大全、天氣查詢和日期查詢等。
3 系統實現
3.1 功能模塊設計
首先通過 LM393 雙電壓比較器來檢測周圍環境聲音的 強度,當聲音強度達到預設值時,系統啟動,開始錄音。錄 音結束后,通過 post 方式向百度語音平臺請求語音識別服務, 然后接收反饋數據。本系統通過對識別結果的分析做出相應 的響應,然后將處理后的文字信息上傳到圖靈平臺,實現智能 語音的目的。
系統對圖靈平臺處理后的數據進行分析,并發送到百度 語音平臺,請求語音合成服務,再驅動聲卡程序播放合成的聲 音。語言合成功能是在無需本系統處理命令的情況下(如聊天 等)將百度語音合成的文字轉交給圖靈處理,圖靈處理完成 后再交給百度語音進行合成,待接收到合成后的語音時即可 用系統的揚聲器播放出來。
3.2 主要實現代碼
圖靈平臺部分代碼如下:
3.3 系統外觀和內部結構圖
系統外觀和內部結構如圖 2、圖 3 所示。
4 結 語
本文主要介紹了在 Linux 操作系統下使用 Cortex-A53 處 理器設計實現的智能云鏡系統。本系統具有良好的交互性, 體現了物聯網感知層的特定含義。系統實現了文字、音頻、紅 外等信息的采集和處理。基于物聯網技術把圖靈平臺與百度語 音巧妙結合,使一面普通的鏡子有了“生命”,可以跟用戶自由 交流。