Tento dokument popisuje použité metody a realizaci funkčního prototypu inteligentního ovladače kamery s využitím počítače Raspberry Pi model B. Takové zařízení na základě analýzy zaznamenaných zvukových signálů rotuje kamerou ve směru zvukového zdroje. Lze jej použít při pořizování videozáznamu pohybujícího se mluvčího bez nutnosti obsluhy kamery člověkem. Úhel natočení servomotoru kamery je stanoven podle hodnoty fázového posunu signálů zaznamenaných dvěma mikrofony. Ke zjištění tohoto posunutí je použita metoda křížové korelace, na jejíž výsledky je aplikována kvadratická interpolace, jejíž maximální výsledek poskytuje přesnější hodnotu fázového posunu. Dosažení optimálního řízení servomotoru zajišťuje aplikace Kalmanova filtru na výsledné hodnoty fázového posunu. Celý program je implementován v jazyce Python verze 2.7. Součástí této práce jsou rozbory provedených experimentů, které prokazují krátkou časovou odezvu zařízení.
Anotace v angličtině
This document describes methods and an implementation of functional prototype of intelligent camera controller based on Raspberry Pi Model B. The device rotates camera in the direction of a sound source depending on the analysis of recorded sound signals. It can be used for taking a video of a moving speaker without the need of human operator. The angle of servo rotation is determined by phase shift of signals recorded with two microphones. The phase shift value is given by the cross-correlation method, on whose results the method of quadratic interpolation is applied. The maximum value provides more accurate value of the phase shift. The best result of servo controlling provides Kalman filter application on the solved phase shift values. The whole code is implemented in programming language Python 2.7. Part of this document describes experiments whose analysis proves a fast response of the device.
Klíčová slova
Raspberry Pi, stereofonní záznam zvuku, analýza zvukového signálu, sledování zdroje zvuku kamerou, zařízení pracující v reálném čase, Python
Klíčová slova v angličtině
Raspberry Pi, stereophonic sound recording, sound signal analysis, sound source camera tracking, real-time device, Python
Rozsah průvodní práce
46
Jazyk
CZ
Anotace
Tento dokument popisuje použité metody a realizaci funkčního prototypu inteligentního ovladače kamery s využitím počítače Raspberry Pi model B. Takové zařízení na základě analýzy zaznamenaných zvukových signálů rotuje kamerou ve směru zvukového zdroje. Lze jej použít při pořizování videozáznamu pohybujícího se mluvčího bez nutnosti obsluhy kamery člověkem. Úhel natočení servomotoru kamery je stanoven podle hodnoty fázového posunu signálů zaznamenaných dvěma mikrofony. Ke zjištění tohoto posunutí je použita metoda křížové korelace, na jejíž výsledky je aplikována kvadratická interpolace, jejíž maximální výsledek poskytuje přesnější hodnotu fázového posunu. Dosažení optimálního řízení servomotoru zajišťuje aplikace Kalmanova filtru na výsledné hodnoty fázového posunu. Celý program je implementován v jazyce Python verze 2.7. Součástí této práce jsou rozbory provedených experimentů, které prokazují krátkou časovou odezvu zařízení.
Anotace v angličtině
This document describes methods and an implementation of functional prototype of intelligent camera controller based on Raspberry Pi Model B. The device rotates camera in the direction of a sound source depending on the analysis of recorded sound signals. It can be used for taking a video of a moving speaker without the need of human operator. The angle of servo rotation is determined by phase shift of signals recorded with two microphones. The phase shift value is given by the cross-correlation method, on whose results the method of quadratic interpolation is applied. The maximum value provides more accurate value of the phase shift. The best result of servo controlling provides Kalman filter application on the solved phase shift values. The whole code is implemented in programming language Python 2.7. Part of this document describes experiments whose analysis proves a fast response of the device.
Klíčová slova
Raspberry Pi, stereofonní záznam zvuku, analýza zvukového signálu, sledování zdroje zvuku kamerou, zařízení pracující v reálném čase, Python
Klíčová slova v angličtině
Raspberry Pi, stereophonic sound recording, sound signal analysis, sound source camera tracking, real-time device, Python
Zásady pro vypracování
Sestavte zařízení s kamerou, natáčecím zařízením pro ovládání kameru, dvěma mikrofony a minipočítačem Raspberry Pi.
Vytvořte aplikaci pro Raspberry Pi, která bude kontinuálně sledovat zvuk ze dvou mikrofonů, vyhodnocovat směr příchodu akustického signálu a podle toho vyšle příkaz k natočení kamery směrem ke zdroji.
Vyřešte detaily jako je optimalizace způsobu vyhodnocování směru příchodu zvuku, úspora energie, inteligentní sledování zdroje (Kalmanův filtr) a vyřešte problémy kalibrace.
Zařízení ověřte v praxi.
Zásady pro vypracování
Sestavte zařízení s kamerou, natáčecím zařízením pro ovládání kameru, dvěma mikrofony a minipočítačem Raspberry Pi.
Vytvořte aplikaci pro Raspberry Pi, která bude kontinuálně sledovat zvuk ze dvou mikrofonů, vyhodnocovat směr příchodu akustického signálu a podle toho vyšle příkaz k natočení kamery směrem ke zdroji.
Vyřešte detaily jako je optimalizace způsobu vyhodnocování směru příchodu zvuku, úspora energie, inteligentní sledování zdroje (Kalmanův filtr) a vyřešte problémy kalibrace.
Zařízení ověřte v praxi.
Seznam doporučené literatury
\renewcommand{\labelenumi}{[\arabic{enumi}]}
I. Tashev, "Sound Capture and Processing" Practical Approaches", Wiley, 2008.
B. Porat, "A Course in Digital Signal Processing", John Wiley & Sons, 1997
Seznam doporučené literatury
\renewcommand{\labelenumi}{[\arabic{enumi}]}
I. Tashev, "Sound Capture and Processing" Practical Approaches", Wiley, 2008.
B. Porat, "A Course in Digital Signal Processing", John Wiley & Sons, 1997
Přílohy volně vložené
1 CD ROM
Přílohy vázané v práci
ilustrace, grafy, schémata
Převzato z knihovny
Ne
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
Průběh obhajoby je zveřejněn pouze přihlášenému uživateli.