|
RT-Thread
在工業(yè)領域、高安全高可靠性領域,實時操作系統(tǒng)在其中發(fā)揮著重要的作用,從毫秒級,微秒級實時響應,決定著裝置系統(tǒng)能滿足何種嚴苛的要求。
RT-Thread Smart操作系統(tǒng)是一套基于RT-Thread內核,并具備POSIX用戶態(tài)運行環(huán)境的高性能實時操作系統(tǒng)。它類似Linux、Windows的架構,具備用戶態(tài)和內核態(tài)(并相分離),用戶態(tài)具備全地址空間(進程模型),啟用了A核芯片中的MMU,多級頁表,實現了在A核SoC大芯片上的實時控制系統(tǒng)。
RT-Thread Smart在具備POSIX用戶態(tài)運行環(huán)境后,其實時性如何,和一般的RTOS相比,和通用的帶實時補丁Linux操作系統(tǒng)相比,它的實時性能力到底如何。希望通過本文的測試給到大家一個對比認識。
測試平臺
所有測試基于相同的一塊瑞芯微 RK3566開發(fā)板,RK3566攜帶四核 64 位高性能 ARM Cortex-A55 處理器,主頻 1.8GHz,4GB LPDDR4X 內存。
RT-Thread 內核基于開源主線倉庫 master 分支,平臺 SDK 基于 RT-Thread Smart 專業(yè)版本,使用 gcc 工具鏈,優(yōu)化等級 O2。
Linux-RT 內核版本基于 linux-orangepi 倉庫 orange-pi-5.10-rk35xx-rt 分支,5.10內核版本并已經開啟了實時補丁選項。
Zephyr內核版本基于開源主線倉庫master分支,commit:7a492d308828b928074816c49d38de18b4dcfbb4, 編譯優(yōu)化等級通過 Kconfig 配置為 O2。
RTOS 實時性能測試工具
首先是傳統(tǒng)的實時操作系統(tǒng)測試對比,對比的另一實時操作系統(tǒng)選擇的是Zephyr實時操作系統(tǒng),都運行在4核SMP模式下進行測試。本次測試工具選擇相同的測試用例代碼,用于衡量不同的壓力負載下的 RTOS 綜合實時性能指標。
指標由以下三個部分構成:中斷響應時延 + 異步通知時延 + 實時任務調度時延。這三個部分加起來的時間越短越好,同時多次測量的值分布越集中越好。
qg5u33z35sf64023440248.png (6.64 KB, 下載次數: 0)
下載附件
保存到相冊
qg5u33z35sf64023440248.png
2024-9-19 23:48 上傳
測試用例實現方式是在一個實時任務上通過高精度定時器設定一個時延,并掛起該任務。在中斷到來時,通過同步原語通知實時任務異步事件到來,并喚醒。然后計算這段時間相對于期望時延的差值,得到這期間的時延數據。通過多次采樣,施加不同的壓力負載,獲得 RTOS 在不同情況下的實時性能指標情況。壓力負載則模擬 cpu、中斷響應、訪存操作。
d53jpq0ztjx64023440349.jpg (86.01 KB, 下載次數: 0)
下載附件
保存到相冊
d53jpq0ztjx64023440349.jpg
2024-9-19 23:48 上傳
RTOS 實時性測試結果對比
wkyv1kkpjnz64023440449.png (164.68 KB, 下載次數: 0)
下載附件
保存到相冊
wkyv1kkpjnz64023440449.png
2024-9-19 23:48 上傳
點擊放大??查看更清晰
測試分成了4種情況:
● 無壓力負載時測試數據,類似于其他都不運行,而是空跑;
● CPU計算負荷下的測試數據,使用 Dhrystone 測試 CPU 負載,它是一種典型的整數運算基準程序,用于模擬高強度的計算場景,以評估系統(tǒng)在繁忙時的實時響應能力。
● IO/中斷負荷下的測試數據,通過 IPI(Inter-Processor Interrupts)生成大量中斷請求,測試系統(tǒng)在執(zhí)行 IO 操作處理高頻中斷場景下的實時性能。
● 內存負荷下的測試數據,使用 MBW 測試工具進行內存帶寬壓力測試,模擬大規(guī)模數據傳輸的場景,考察系統(tǒng)在內存資源緊張時的實時響應情況。
通過上述結果可以發(fā)現:RT-Thread Smart基本指標在2.4us的延遲,當IO/中斷,CPU計算負荷,內存負荷上去時,最大延遲會上升到8us附近。而Zephyr實時操作系統(tǒng)在一些極限點上延遲會到15us,甚至略顯夸張的525us(還好不是1ms?)。
cyclictest測試
cyclictest是Linux上非常流行、常見的實時性測試工具,它通過使用高精度定時器來測量兩個時間點的延時:
wq5bsv0uuri64023440549.png (14.27 KB, 下載次數: 0)
下載附件
保存到相冊
wq5bsv0uuri64023440549.png
2024-9-19 23:48 上傳
cyclictest 源碼來自項目 rt-tests release v1.0,參考官方 wiki :
https://wiki.linuxfoundation.org/realtime/documentation/howto/tools/cyclictest/start
它編譯出來是一份用戶態(tài)測試程序,這份代碼在Linux,RT-Thread Smart上都不需要進行修改,直接通過gcc交叉工具鏈采用O2優(yōu)化選項進行編譯即可。
Linux 測試使用命令:cyclictest -p 95 -d 0 -i 1000 -D 10m -m -n --histogram=100
rt-smart 測試使用命令:cyclictest -d 0 -i 1000 -D 10m -m -n --histogram=20(Linux 優(yōu)先級規(guī)則與 rt-thread 不同,保證 cyclictest 是系統(tǒng)中最高優(yōu)先級任務即可)
cpu 負載:在后臺啟動 dhrystone 任務。通過 top 命令觀察,每個核啟動一個時 cpu 占用率峰值可以達到 99.7% 以上。
內存負載:執(zhí)行 cyclictest 測試的同時,運行 mbw 任務模擬高內存負載環(huán)境。
IO 負載:執(zhí)行 cyclictest 測試的同時,運行 iperf 服務,并連接客戶端測試,以此模擬高網絡(IO)負載環(huán)境。
cyclic 測試指標對比
dxmlyensg4q64023440649.png (99.11 KB, 下載次數: 0)
下載附件
保存到相冊
dxmlyensg4q64023440649.png
2024-9-19 23:48 上傳
nfku0ulwjwk64023440749.png (127.22 KB, 下載次數: 0)
下載附件
保存到相冊
nfku0ulwjwk64023440749.png
2024-9-19 23:48 上傳
點擊放大??查看更清晰
上述是兩份對比圖,前面的是cyclictest的min/avg/max對比圖?梢钥吹絉T-Thread Smart的實時性表現都比較好,max值在11/12us左右,在內存負載的情況下max值會到30+us。
下面的圖則是時延數據的分布情況,可以發(fā)現相對于 Linux-RT,rt-smart 下的測試指標在各類負載下的重復實驗中基本上都比較集中。因此同為支持到POSIX用戶態(tài)應用程序的RT-Thread Smart操作系統(tǒng),相比較帶實時補丁的Linux來說,它的實時性優(yōu)勢也是非常明顯,相當于提供POSIX應用程序的同時,依然具備非常好的實時性能力。
性能優(yōu)化是一個持久而漫長的過程,這個其中需要持續(xù)的定位整體系統(tǒng)中的性能損耗點,所以在這個過程中我們也在不斷迭代、追求極致,并加入更有效的手段、工具來輔助定位及解決問題。
猜你喜歡:
WiFi6+藍牙+星閃,三合一開發(fā)板,真香!
Github上熱門 C 語言項目匯總!
嵌入式,可測試性軟件設計!
一些低功耗軟件設計的要點!
嵌入式 C 保護結構體的方式
實用 | 10分鐘教你通過網頁點燈
談談嵌入式軟件的兼容性! |
|