用于顯示用戶接口的系統和方法
【專利摘要】本發明描述一種用于在電子裝置上顯示用戶接口的方法。所述方法包含呈現用戶接口。所述用戶接口包含坐標系。所述坐標系基于傳感器數據而對應于物理坐標。所述方法還包含提供允許選擇所述坐標系的至少一個扇區的扇區選擇特征。所述方法進一步包含提供允許編輯所述至少一個扇區的扇區編輯特征。
【專利說明】用于顯示用戶接口的系統和方法
[0001] 相關申請案
[0002] 本申請案涉及2012年10月12日申請的第61/713, 447號美國臨時專利申請 案"用于映射坐標的系統和方法(SYSTEMS AND METHODS FOR MAPPING COORDINATES)"、 2012年10月15日申請的第61/714,212號美國臨時專利申請案"用于映射坐標的系統 和方法(SYSTEMS AND METHODS FOR MAPPING C00RDINATES)"、2012年 4 月 13 日申請的 第61/624, 181號美國臨時專利申請案"用于估計到達方向的系統、方法及設備(SYSTEMS, METHODS, AND APPARATUS FOR ESTIMATING DIRECTION OF ARRIVAL)"、2012年5月 4 日 申請的第61/642, 954號美國臨時專利申請案"用于估計到達方向的系統、方法及設備 (SYSTEMS,METH0DS,AND APPARATUS FOR ESTIMATING DIRECTION OF ARRIVAL)",及2012年 11月14日申請的第61/726, 336號美國臨時專利申請案"用于估計到達方向的系統、方法 及設備(SYSTEMS,METHODS,AND APPARATUS FOR ESTIMATING DIRECTION OF ARRIVAL)" 且 主張所述申請案的權益。
【技術領域】
[0003] 本發明大體上涉及電子裝置。更具體來說,本發明涉及用于顯示用戶接口的系統 和方法。
【背景技術】
[0004] 在過去幾十年中,電子裝置的使用已變得常見。具體來說,電子技術的進步已減少 越來越復雜且有用的電子裝置的成本。成本減少和消費者需求已使電子裝置的使用激增, 使得電子裝置在現代社會中幾乎無所不在。隨著電子裝置的使用已擴大,對電子裝置的新 的和改進型特征的需求也擴大。更特定來說,較快速、較有效地執行功能或具有較高質量的 電子裝置常常廣受歡迎。
[0005] -些電子裝置(例如,蜂窩式電話、智能電話、計算機等等)使用音頻或話語信號。 這些電子裝置可譯碼話語信號以用于存儲或發射。舉例來說,蜂窩式電話使用麥克風俘獲 用戶的語音或話語。麥克風將聲信號轉換為電子信號。此電子信號可接著經格式化(例如, 經譯碼)以用于發射到另一裝置(例如,蜂窩式電話、智能電話、計算機等等)以用于回放 或用于存儲。
[0006] 有噪聲的音頻信號可引起特定挑戰。舉例來說,計算音頻信號可能降低所要的音 頻信號的質量。如從本論述可看出,提高電子裝置中的音頻信號質量的系統和方法可為有 益的。
【發明內容】
[0007] 描述一種用于在電子裝置上顯示用戶接口的方法。所述方法包含呈現用戶接口。 所述用戶接口包含坐標系。所述坐標系基于傳感器數據而對應于物理坐標。所述方法還包 含提供允許選擇所述坐標系的至少一個扇區的扇區選擇特征。所述方法進一步包含提供允 許編輯所述至少一個扇區的扇區編輯特征。
[0008] 所述方法可包含顯示由至少一個麥克風俘獲的至少一個音頻信號的方向性。所述 至少一個目標音頻信號可包含話音信號。所述方法可包含顯示對應于所述至少一個音頻信 號的圖標。顯示圖標可包含顯示用于目標音頻信號的圖標和/或用于干擾音頻信號的圖 標。
[0009] 所述方法可包含傳遞在所述至少一個扇區內指示的音頻信號。所述方法可包含衰 減未在所述至少一個扇區內指示的音頻信號。所述方法可包含指示來自一或多個圖像傳感 器的圖像數據。所述方法可包含傳遞基于所述一或多個扇區的圖像數據。
[0010] 所述方法可包含顯示對應于所述至少一個扇區的至少一個觸摸點。所述方法還可 包含接收對應于所述至少一個觸摸點的觸摸輸入。所述方法可進一步包含基于所述觸摸輸 入來編輯所述至少一個扇區。
[0011] 所述方法可包含使所述用戶接口的至少一部分與參考平面對準。所述參考平面可 為水平的。對準所述用戶接口的至少一部分可包含將二維極坐標圖映射到三維顯示空間 中。
[0012] 所述物理坐標可為地球坐標。所述物理坐標可表示獨立于地球坐標的物理空間。 所述坐標系可維持獨立于電子裝置定向的定向。
[0013] 所述方法可包含辨識音頻簽名。所述方法還可包含在數據庫中查找所述音頻簽 名。所述方法可進一步包含獲得對應于所述音頻簽名的識別信息。所述方法可另外包含在 所述用戶接口上顯示所述識別信息。所述識別信息可為對應于所述音頻簽名的人的圖像。 所述方法可包含提供固定模式及可編輯模式。所述方法可包含填補所選擇的扇區。
[0014] 所述扇區選擇特征及所述扇區編輯特征中的至少一者可基于單點觸摸輸入和/ 或多點觸摸輸入而操作。所述扇區選擇特征可使得能夠一次選擇多個扇區。所述扇區編輯 特征可使得能夠基于單點或多點觸摸輸入來調整所述扇區。所述扇區選擇特征可基于一或 多個滑動輸入。所述一或多個滑動輸入可指示圓形區。所述一或多個滑動輸入可為單一滑 動。
[0015] 還描述一種電子裝置。所述電子裝置包含顯示器。所述顯示器呈現用戶接口。所 述用戶接口包含坐標系。所述坐標系基于傳感器數據而對應于物理坐標。所述顯示器提供 允許選擇所述坐標系的至少一個扇區的扇區選擇特征。所述顯示器還提供允許編輯所述至 少一個扇區的扇區編輯特征。
[0016] 還描述一種用于顯示用戶接口的計算機程序產品。所述計算機程序產品包含具有 指令的非暫時性有形計算機可讀媒體。所述指令包含用于導致電子裝置呈現用戶接口的代 碼。所述用戶接口包含坐標系。所述坐標系基于傳感器數據而對應于物理坐標。所述指令 還包含用于導致所述電子裝置提供允許選擇所述坐標系的至少一個扇區的扇區選擇特征 的代碼。所述指令進一步包含用于導致所述電子裝置提供允許編輯所述至少一個扇區的扇 區編輯特征的代碼。
[0017] 還描述一種用于顯示用戶接口的設備。所述設備包含用于呈現用戶接口的裝置。 所述用戶接口包含坐標系。所述坐標系基于傳感器數據而對應于物理坐標。所述設備還包 含用于提供允許選擇所述坐標系的至少一個扇區的扇區選擇特征的裝置。所述設備另外包 含用于提供允許編輯所述至少一個扇區的扇區編輯特征的裝置。
【專利附圖】
【附圖說明】
[0018] 圖1展示多麥克風手持機的多個視圖;
[0019] 圖2A展示相對于麥克風對的平面波傳播的遠場模型;
[0020] 圖2B展示線性陣列中的多個麥克風對;
[0021] 圖3A展示針對四個不同到達方向(DOA)的解開的相位延遲對頻率的曲線圖;
[0022] 圖3B展示針對圖3A中所描繪的相同的四個不同到達方向的纏繞的相位延遲對頻 率的曲線圖;
[0023] 圖4A展示兩個DOA候選者的所測量的相位延遲值及所計算的值的實例;
[0024] 圖4B展示沿著電視屏幕的頂部邊緣布置的麥克風的線性陣列;
[0025] 圖5A展示計算幀的DOA差的實例;
[0026] 圖5B展示計算DOA估計的實例;
[0027] 圖5C展示識別每一頻率的DOA估計的實例;
[0028] 圖6A展示使用所計算的似然度來識別針對給定頻率的最佳麥克風對及最佳DOA 候選者的實例;
[0029] 圖6B展示似然度計算的實例;
[0030] 圖7展示偏壓去除的實例;
[0031] 圖8展示偏壓去除的另一實例;
[0032] 圖9展示在幀及頻率上繪制所估計的DOA處的源活動性似然度的角度圖的實例;
[0033] 圖IOA展示揚聲器電話應用的實例;
[0034] 圖IOB展示在麥克風陣列的平面中逐對DOA估計到360°范圍的映射;
[0035] 圖IIA到B展示DOA估計中的模糊性;
[0036] 圖IlC展示所觀測的DOA的正負號與x-y平面的象限之間的關系;
[0037] 圖12A到12D展示其中源位于麥克風平面上方的實例;
[0038] 圖13A展示沿著非正交軸的麥克風對的實例;
[0039] 圖13B展示使用圖13A的陣列獲得相對于正交的X及y軸的DOA估計的實例;
[0040] 圖13C說明針對兩個不同DOA的實例的不同陣列的麥克風處的并行波前到達之間 的關系;
[0041] 圖14A到14B展示兩對麥克風陣列的逐對歸一化的波束成形器/零限波束成形器 (BFNF)的實例;
[0042] 圖15A展示兩對麥克風陣列;
[0043] 圖15B展示逐對歸一化的最小方差無失真響應(MVDR)BFNF的實例;
[0044] 圖16A展示其中矩陣AhA不處于病態的頻率的逐對BFNF的實例;
[0045] 圖16B展示導向向量的實例;
[0046] 圖17展示如本文所描述的源方向估計的一體化方法的一個實例流程圖;
[0047] 圖18到31展示如本文所描述的DOA估計、源鑒別及源跟蹤的實際結果的實例;
[0048] 圖32A展示電話設計,且圖32B到32D展示與對應的可視化顯示器一起在各種模 式中使用此類設計;
[0049] 圖33A展示根據一般配置的方法MlO的流程圖;
[0050] 圖33B展示任務TlO的實施方案T12 ;
[0051] 圖33C展示任務TlO的實施方案T14 ;
[0052] 圖33D展示方法MlO的實施方案M20的流程圖;
[0053] 圖34A展示方法M20的實施方案M25的流程圖;
[0054] 圖34B展示方法MlO的實施方案M30的流程圖;
[0055] 圖34C展示方法M30的實施方案MlOO的流程圖;
[0056] 圖35A展示方法MlOO的實施方案MllO的流程圖;
[0057] 圖35B展示根據一般配置的設備A5的框圖;
[0058] 圖35C展示設備A5的實施方案AlO的框圖;
[0059] 圖3?展示設備AlO的實施方案A15的框圖;
[0060] 圖36A展示根據一般配置的設備MF5的框圖;
[0061] 圖36B展示設備MF5的實施方案MFlO的框圖;
[0062] 圖36C展示設備MFlO的實施方案MF15的框圖;
[0063] 圖37A說明使用裝置來表示在所述裝置的平面中的三維到達方向;
[0064] 圖37B說明表示具有與定位在軸平面外部的點源非正交的軸的麥克風陣列的相 應響應的混淆錐的交叉點;
[0065] 圖37C說明圖37B的圓錐的相交的線;
[0066] 圖38A展示音頻預處理級的框圖;
[0067] 圖38B展示音頻預處理級的三通道實施方案的框圖;
[0068] 圖39A展示包含用于指示到達方向的裝置的設備的實施方案的框圖;
[0069] 圖39B展示由來自線性陣列的DOA估計的單向度產生的模糊性的實例;
[0070] 圖39C說明混淆錐的一個實例;
[0071] 圖40展示其中三個源相對于具有線性麥克風陣列的裝置位于不同相應方向上的 揚聲器電話應用中的源混淆的實例;
[0072] 圖41A展示包含具有正交軸的兩個麥克風對的2-D麥克風陣列;
[0073] 圖41B展示包含多個任務的根據一般配置的方法的流程圖;
[0074] 圖41C展示在顯示器上展示的DOA估計的實例;
[0075] 圖42A展示I-D估計的正負號與由陣列軸界定的平面的對應象限之間的對應關系 的一個實例;
[0076] 圖42B展示I-D估計的正負號與由陣列軸界定的平面的對應象限之間的對應關系 的另一實例;
[0077] 圖42C展示元組(sign( θ x),sign( Θ y))的四個值與平面的象限之間的對應關 系;
[0078] 圖42D展示根據替代性映射的360度顯示器;
[0079] 圖43A展示類似于圖41A但描繪其中源位于x-y平面上方的更一般的情況的實 例;
[0080] 圖43B展示其軸界定X-y平面的2-D麥克風陣列及位于X-y平面上方的源的另一 實例;
[0081] 圖43C展示其中點源在由陣列軸界定的平面上方升高的此一般情況的實例;
[0082] 圖44A到44D展示(θ χ,Θ y)轉換為陣列平面中的角度的推導;
[0083] 圖44E說明投影p及仰角的角度的一個實例;
[0084] 圖45A展示通過應用替代性映射而獲得的曲線圖;
[0085] 圖45B展示與具有與共同點源非正交的軸X及r的線性麥克風陣列的響應相關聯 的相交的混淆錐的實例;
[0086] 圖45C展示圓錐的交叉點的線;
[0087] 圖46A展示麥克風陣列的實例;
[0088] 圖46B展示使用來自圖46A中所示的陣列的觀測(θ χ,Θ J相對于正交軸X及y 獲得χ-y平面中的組合方向性估計的實例;
[0089] 圖46C說明投影的一個實例;
[0090] 圖46D說明從投影向量的維度確定值的一個實例;
[0091] 圖46E說明從投影向量的維度確定值的另一實例;
[0092] 圖47A展示根據包含任務的實例的另一一般配置的方法的流程圖;
[0093] 圖47B展示包含子任務的任務的實施方案的流程圖;
[0094] 圖47C說明具有用于執行對應于圖47A的功能的組件的設備的一個實例;
[0095] 圖47D說明包含用于執行對應于圖47A的功能的裝置的設備的一個實例;
[0096] 圖48A展示包含任務的方法的一個實施方案的流程圖;
[0097] 圖48B展示另一方法的實施方案的流程圖;
[0098] 圖49A展示方法的另一實施方案的流程圖;
[0099] 圖49B說明相對于顯示平面的仰角的所估計的角度的指示的一個實例;
[0100] 圖49C展示包含任務的另一方法的此實施方案的流程圖;
[0101] 圖50A及50B展示在旋轉之前及之后的顯示器的實例;
[0102] 圖51A及51B展示在旋轉之前及之后的顯示器的其它實例;
[0103] 圖52A展示其中裝置坐標系E與世界坐標系對準的實例;
[0104] 圖52B展示其中旋轉裝置的實例及對應于定向的矩陣F ;
[0105] 圖52C展示DOA到世界參考平面上的投影的到裝置的顯示平面上的透視映射;
[0106] 圖53A展示投射到世界參考平面上的DOA的映射顯示器的實例;
[0107] 圖53B展示方法的此類另一實施方案的流程圖;
[0108] 圖53C說明包含線性滑塊電位計、搖臂開關及輪或旋鈕的接口的實例;
[0109] 圖54A說明用戶接口的一個實例;
[0110] 圖54B說明用戶接口的另一實例;
[0111] 圖54C說明用戶接口的另一實例;
[0112] 圖55A及55B展示其中使用定向傳感器來跟蹤裝置的定向的另一實例;
[0113] 圖56是說明其中可實施用于映射源位置的系統和方法的電子裝置的一個配置的 框圖;
[0114] 圖57是說明用于映射源位置的方法的一個配置的流程圖;
[0115] 圖58是說明其中可實施用于映射源位置的系統和方法的電子裝置的更特定的配 置的框圖;
[0116] 圖59是說明用于映射源位置的方法的更特定的配置的流程圖;
[0117] 圖60是說明用于基于所述映射執行操作的方法的一個配置的流程圖;
[0118] 圖61是說明用于基于所述映射執行操作的方法的另一配置的流程圖;
[0119] 圖62是說明其中可實施用于在電子裝置上顯示用戶接口的系統和方法的用戶接 口的一個配置的框圖;
[0120] 圖63是說明用于在電子裝置上顯示用戶接口的方法的一個配置的流程圖;
[0121] 圖64是說明其中可實施用于在電子裝置上顯示用戶接口的系統和方法的用戶接 口的一個配置的框圖;
[0122] 圖65是說明用于在電子裝置上顯示用戶接口的方法的更特定的配置的流程圖;
[0123] 圖66說明用于顯示至少一個音頻信號的方向性的用戶接口的實例;
[0124] 圖67說明用于顯示至少一個音頻信號的方向性的用戶接口的另一實例;
[0125] 圖68說明用于顯示至少一個音頻信號的方向性的用戶接口的另一實例;
[0126] 圖69說明用于顯示至少一個音頻信號的方向性的用戶接口的另一實例;
[0127] 圖70說明用于顯示至少一個音頻信號的方向性的用戶接口的另一實例;
[0128] 圖71說明用戶接口的扇區選擇特征的實例;
[0129] 圖72說明用戶接口的扇區選擇特征的另一實例;
[0130] 圖73說明用戶接口的扇區選擇特征的另一實例;
[0131] 圖74說明用戶接口的扇區選擇特征的更多實例;
[0132] 圖75說明用戶接口的扇區選擇特征的更多實例;
[0133] 圖76是說明用于編輯扇區的方法的一個配置的流程圖;
[0134] 圖77說明用戶接口的扇區編輯特征的實例;
[0135] 圖78說明用戶接口的扇區編輯特征的更多實例;
[0136] 圖79說明用戶接口的扇區編輯特征的更多實例;
[0137] 圖80說明用戶接口的扇區編輯特征的更多實例;
[0138] 圖81說明用戶接口的扇區編輯特征的更多實例;
[0139] 圖82說明具有獨立于電子裝置定向而定向的坐標系的用戶接口的實例;
[0140] 圖83說明具有獨立于電子裝置定向而定向的坐標系的用戶接口的另一實例;
[0141] 圖84說明具有獨立于電子裝置定向而定向的坐標系的用戶接口的另一實例;
[0142] 圖85說明具有獨立于電子裝置定向而定向的坐標系的用戶接口的另一實例;
[0143] 圖86說明具有獨立于電子裝置定向而定向的坐標系的用戶接口的更多實例;
[0144] 圖87說明具有獨立于電子裝置定向而定向的坐標系的用戶接口的另一實例;
[0145] 圖88是說明其中可實施用于在電子裝置上顯示用戶接口的系統和方法的用戶接 口的另一配置的框圖;
[0146] 圖89是說明用于在電子裝置上顯示用戶接口的方法的另一配置的流程圖;
[0147] 圖90說明耦合到數據庫的用戶接口的實例;
[0148] 圖91是說明用于在電子裝置上顯示用戶接口的方法的另一配置的流程圖;
[0149] 圖92是說明其中可實施用于映射源位置的系統和方法的無線通信裝置的一個配 置的框圖;
[0150] 圖93說明可在電子裝置中利用的各種組件;及
[0151] 圖94說明用戶接口的另一實例。
【具體實施方式】
[0152] 第三代合作伙伴計劃(3GPP)是旨在界定在全球范圍內可適用的第三代(3G)移動 電話規范的電信協會團體之間的合作。3GPP長期演進(LTE)是旨在提高全球移動電信系統 (UMTS)移動電話標準的3GPP計劃。所述3GPP可界定下一代移動網絡、移動系統及移動裝 置的規范。
[0153] 應注意,在一些情況下,可關于一或多個規范來描述本文中揭示的系統和方法,例 如 3GPP 版本 8 (Rel-8)、3GPP 版本 9 (Rel-9)、3GPP 版本 10 (Rel-10)、LTE、LTE 高級(LTE-A)、 全球移動通信系統(GSM)、通用分組無線電服務(GPRS)、GSM演進增強數據速率(EDGE)、 時分長期演進(TD-LTE)、時分同步碼分多址(TD-SCDM)、頻分雙工長期演進(FDD-LTE)、 UMTS、GSM EDGE無線電接入網絡(GERAN)、全球定位系統(GPS)等。然而,本文中所描述的 所述概念中的至少一些可應用于其它無線通信系統。舉例來說,術語電子裝置可用于指代 用戶設備(UE)。此外,術語基站可用于指代術語節點B、演進型節點B(eNB)、歸屬演進型節 點B(HeNB)等中的至少一者。
[0154] 除非受其上下文明確地限制,否則術語"信號"在本文中用以指示其普通意義中的 任一者,包含如在導線、總線或其它傳輸媒體上表達的存儲器位置(或存儲器位置集合)的 狀態。除非受其上下文明確地限制,否則本文中使用術語"產生"來指示其普通意義中的任 一者,例如計算或以其它方式產生。除非受其上下文明確地限制,否則術語"計算"在本文 中用以指示其普通意義中的任一者,例如計算、評估、估計和/或從多個值中進行選擇。除 非受其上下文明確地限制,否則使用術語"獲得"來指示其普通意義中的任一者,例如推算、 導出、接收(例如,從外部裝置)和/或檢索(例如,從存儲元件陣列)。除非受其上下文 明確地限制,否則使用術語"選擇"來指示其普通意義中的任一者,例如識別、指示、應用和 /或使用一組兩者或兩者以上中的至少一者和少于全部。除非受其上下文明確地限制,否 則本文中使用術語"確定"來指示其普通意義中的任一者,例如決定、建立、推斷、推算、選擇 和/或評估。在術語"包括"用于本描述及權利要求書中的情況下,其不排除其它元件或操 作。使用術語"基于"(如在"A是基于B"中)來指示其普通意義中的任一者,包含以下情 況⑴"從中導出"(例如,"B是A的前驅體"至少基于"(例如,"A至少基于B") 以及,在特定上下文中在適當的情況下,(iii) "等于"(例如,"A等于B"或"A與B相同")。 類似地,使用術語"響應于"來指示其普通意義中的任一者,包含"至少響應于"。除非另有 指示,否則術語"A、B及C中的至少一者"及"A、B及C中的一或多者"指示"A和/或B和 / 或 C"。
[0155] 對多麥克風音頻感測裝置的麥克風的"位置"的參考指示所述麥克風的聲敏感面 的中心的位置,除非上下文另有指示。根據特定上下文,有時使用術語"通道"來指示信號路 徑且在其它時候指示由此路徑載運的信號。除非另有指示,否則使用術語"系列"來指示兩 個或兩個以上項目的序列。使用術語"對數"來指示基數為十的對數,但將此運算擴展到其 它基數在本發明的范圍內。使用術語"頻率分量"來指示信號的一組頻率或頻帶中的一者, 例如(例如,由快速傅里葉變換產生非)信號的頻域表示的樣本(或"二進位")或信號的 子帶(例如,巴克(Bark)尺度或梅爾(mel)尺度子帶)。
[0156] 除非另有指示,否則對具有特定特征的設備的操作的任何揭示內容還明確地希望 揭示具有類似特征的方法(且反之亦然),且對根據特定配置的設備的操作的任何揭示內 容還明確地希望揭示根據類似配置的方法(且反之亦然)。術語"配置"可參考由其特定上 下文指示的方法、設備和/或系統來使用。術語"方法"、"過程"、"程序"和"技術"通用地且 可互換地使用,除非特定上下文另有指示。具有多個子任務的"任務"也是方法。術語"設 備"和"裝置"也通用地且可互換地使用,除非特定上下文另有指示。術語"元件"和"模塊" 通常用以指示較大配置的一部分。除非由其上下文明確限制,否則術語"系統"在此用以指 示其普通意義中的任一者,包含"交互以用于共同目的的元件群組"。
[0157] 通過參考文獻的一部分的任何并入也應理解為并入了在所述部分內參考的術語 或變量的定義,其中此些定義出現在文獻中的其它地方,以及并入了在所并入部分中參考 的任何圖。除非起初通過定冠詞引入,否則用于修飾權利要求元素的序數術語(例如,"第 一"、"第二"、"第三"等)本身不指示所述權利要求元素相對于另一權利要求元素的任何優 先級或次序,而是僅區別所述權利要求元素與具有同一名稱(如果沒有序數術語)的另一 權利要求元素。除非通過其上下文明確地限制,否則術語"多個"及"集合"中的每一者在 本文中用以指示大于一的整數數量。
[0158] A.用于估計到達方向的系統、方法和設備
[0159] 一種處理多通道信號的方法包含對于所述多通道信號的多個不同頻率分量中的 每一者,計算所述多通道信號的第一對通道中的每一者中的頻率分量的相位之間的差,以 獲得多個相位差。此方法還包含對于多個候選方向中的每一者,估計候選方向與基于所述 多個相位差的向量之間的誤差。此方法還包含從所述多個候選方向當中選擇對應于所估計 誤差當中的最小誤差的候選方向。在此方法中,所述第一對通道中的每一者是基于由第一 對麥克風中的對應麥克風產生的信號,且不同頻率分量中的至少一者具有小于所述第一對 麥克風中的麥克風之間的距離的兩倍的波長。
[0160] 可假設,在發射聲場的近場和遠場區中,波前分別為球面的和平面的。可將近場定 義為距聲接收器(例如,麥克風陣列)小于一個波長的空間區。在此定義下,到區邊界的距 離與頻率成反比地變化。在200、700和2000赫茲的頻率下,例如,到一個波長邊界的距離 分別為約170厘米、49厘米和17厘米。改為考慮近場/遠場邊界處于距麥克風陣列特定距 離處(例如,距陣列的麥克風或距陣列的質心50厘米,或距陣列的麥克風或距陣列的質心 1米或1. 5米)可為有用的。
[0161] 現參看圖描述各種配置,在各圖中,相似參考數字可指示功能上類似的元件。可以 廣泛多種不同配置來布置及設計如本文中在各圖中所大體描述及說明的系統和方法。因 此,對如各圖中所表示的若干配置的以下更詳細描述并不希望限制如所主張的范圍,而僅 表示系統和方法。圖中所描繪的特征和/或元素可組合至少一個其它圖中所描繪的至少一 個特征和/或元素。
[0162] 圖1展不多麥克風手持機HlOO (例如,多麥克風裝直)的實例,所述多麥克風手持 機包含軸線在裝置的正面的左右方向上的第一麥克風對MV10-1、MV10-3,和軸線在前后方 向上(即,正交于正面)的第二麥克風對MV10-UMV10-2。此類布置可用以確定用戶何時 在裝置的正面說話(例如,瀏覽-通話模式)。前后對可用以解決左右對通常無法就其本身 來解決的前后方向之間的模糊性。在一些實施方案中,手持機HlOO可包含一或多個擴音器 LS10、L20L、LS20R、觸摸屏TS10、鏡頭LlO和/或一或多個額外麥克風ME10、MR10。
[0163] 除如圖1中所展示的手持機之外,可實施以包含多麥克風陣列及執行如本文中所 描述的方法的音頻感測裝置的其它實例還包含便攜式計算裝置(例如,膝上型計算機、筆 記型計算機、上網本計算機、超便攜式計算機、平板計算機、移動因特網裝置、智能筆記本、 智能電話等)、音頻或視頻會議裝置,及顯示屏幕(例如,計算機監視器、電視機)。
[0164] 如圖1中所展示的裝置可經配置以通過以下操作來確定源信號的到達方向 (DOA):測量每一頻段的麥克風通道之間的差異(例如,相位差)以獲得方向指示,及將所有 頻段內的方向指示平均化以確定所估計方向是否在所有頻段上一致。可用于跟蹤的頻段的 范圍通常受麥克風對的空間混疊頻率約束。可將此上限定義為信號的波長為麥克風之間的 距離d的兩倍所在的頻率。此類方法可能不支持對超出一米的源DOA的準確跟蹤且通常可 能僅支持低DOA分辨率。此外,對依賴前后對解決模糊性的相依性可能為對麥克風放置幾 何布置的顯著約束,這是因為將裝置放置在表面上可有效地遮擋前麥克風或后麥克風。此 類方法通常還僅使用一個固定對來用于跟蹤。
[0165] 可能需要提供一種通用揚聲器電話應用,以使得可任意地放置多麥克風裝置(例 如,放置在電話會議的表格上、放置在汽車座椅上等)且跟蹤及/或提高個人說話者的話 音。此類方法可能能夠關于可用麥克風的任意定向處置任意目標說話者位置。還可能需要 此類方法提供瞬時多說話者跟蹤/分離能力。不幸的是,當前現有技術水平為單麥克風方 法。
[0166] 還可能需要支持遠場應用中的源跟蹤,所述源跟蹤可用以提供用于跟蹤處于大距 離處且關于多麥克風裝置定向未知的源的解決方案。此類應用中的多麥克風裝置可包含安 裝于電視機或機頂盒上的可用以支持電話的陣列。實例包含Kinect裝置陣列(微軟公司, 雷蒙德華盛頓州)和Skype陣列(微軟Skype分部)及三星電子(韓國漢城)。除大的源 到裝置距離之外,此類應用通常還遭受不良信號對干擾加噪聲比(SINR)和房間混響。
[0167] 挑戰是提供一種用于針對同時發生的多個聲音事件估計音頻信號的每一幀的三 維到達方向(DOA)的方法,所述音頻信號在背景噪聲和混響下足夠穩健。可通過將可靠頻 段的數目最大化來獲得穩健性。可能需要此類方法適合于任意成形的麥克風陣列幾何布 置,以使得可避免對麥克風幾何布置的特定約束。可將如本文所描述的成對I-D方法適當 地并入到任何幾何布置中。
[0168] 本文中所揭示的系統和方法可針對此類通用揚聲器電話應用或遠場應用來實施。 可實施此類方法以在無麥克風放置約束的情況下操作。還可實施此類方法以使用上達尼奎 斯特頻率及下到較低頻率的可用頻段來跟蹤源(例如,通過支持使用具有較大麥克風間距 離的麥克風對)。不是限于單對用于跟蹤,而是,可實施此類方法以在所有可用對當中選擇 最好的對。此類方法可用以支持甚至遠場情境(高達3米到5米或大于5米的距離)中的 源跟蹤,及提供高得多的DOA分辨率。其它可能的特征包含獲得作用中源的確切2-D表示。 對于最好的結果,可能需要每一源為稀疏寬帶音頻源,且每一頻段大部分受不超過一個源 支配。
[0169] 圖33A展示根據一般配置的包含任務TKKT20和T30的方法MlO的流程圖。任務 TlO計算多通道信號的一對通道之間的差異(例如,其中每一通道是基于由對應麥克風產 生的信號)。對于多個(K個)候選方向當中的每一者,任務T20計算基于所計算的差異的 對應方向誤差。基于K個方向誤差,任務T30選擇候選方向。
[0170] 方法MlO可經配置以將多通道信號作為一連串片段來處理。典型片段長度的范圍 為從約5或10毫秒到約40或50毫秒,且所述片段可為重疊的(例如,與鄰近片段重疊達 25%或50%)或非重疊的。在一個特定實例中,將多通道信號劃分成一連串非重疊片段或 "幀",每一者的長度為10毫秒。在另一特定實例中,每一幀的長度為20毫秒。如通過方法 MlO處理的片段還可為如通過不同操作處理的較大片段(即,子幀),或反過來也是一樣。
[0171] 通道之間的差異的實例包含增益差或比率、到達時間差和相位差。舉例來說,可實 施任務TlO以將一對通道之間的差異計算為所述通道的對應增益值之間的差或比率(例 如,量值或能量差)。圖33B展示任務TlO的此類實施方案T12。
[0172] 可實施任務T12以計算時域(例如,對于信號的多個子帶中的每一者)或頻域(例 如,對于變換域中的信號的多個頻率分量中的每一者,例如,快速傅里葉變換(FFT)、離散余 弦變換(DCT)或經修改的DCT (MDCT)域)中的多通道信號的片段的增益的量度。此類增益 量度的實例包含(不限于)以下各者:總量值(例如,樣本值的絕對值總和)、平均量值(例 如,每一樣本)、均方根(RMS)幅度、中值量值、峰值量值、峰值能量、總能量(例如,樣本值的 平方總和),及平均能量(例如,每一樣本)。
[0173] 為了在增益差技術情況下獲得準確結果,可能需要將兩個麥克風通道的響應相對 于彼此進行校準。可能需要將低通濾波器應用于多通道信號以使得增益量度的計算限于多 通道信號的音頻頻率分量。
[0174] 可實施任務T12以將增益之間的差計算為對數域(例如,以分貝來計的值)中的 每一通道的對應增益量度值之間的差或等效地計算為線性域中的增益量度值之間的比率。 對于經校準的麥克風對,可采用零增益差來指示源距每一麥克風等距(即,位于所述對的 邊射方向),可采用具有較大正值的增益差來指示源更接近一個麥克風(即,位于所述對的 一個端射方向),且可采用具有較大負值的增益差來指示源更接近另一麥克風(即,位于所 述對的另一端射方向)。
[0175] 在另一實例中,可實施圖33A的任務TlO以執行通道的相交相關以確定距離(例 如,基于多通道信號的通道之間的滯后計算到達時間差)。
[0176] 在另一實例中,實施任務TlO以將一對通道之間的差異計算為每一通道的相位之 間的差(例如,信號的特定頻率分量下)。圖33C展示任務TlO的此類實施方案T14。如下 文所論述,可對于多個頻率分量當中的每一者執行此類計算。
[0177] 對于由一對麥克風直接從相對于麥克風對的軸線的特定到達方向(DOA)的點源 接收的信號,對于每一頻率分量,相位延遲不同,而且取決于麥克風之間的間隔。可將特定 頻率分量(或"頻段")下的相位延遲的所觀測值計算為復數FFT系數的虛數項與復數FFT 系數的實數項的比率的反正切(還被稱為反正切(arctangent))。
[0178] 如圖2A中所展示,特定頻率f下的至少一個麥克風MC10、MC20的源SOl的相位延
【權利要求】
1. 一種用于在電子裝置上顯示用戶接口的方法,其包括: 呈現用戶接口,其中所述用戶接口包括坐標系,其中所述坐標系基于傳感器數據而對 應于物理坐標; 提供允許選擇所述坐標系的至少一個扇區的扇區選擇特征;及 提供允許編輯所述至少一個扇區的扇區編輯特征。
2. 根據權利要求1所述的方法,其進一步包括顯示由至少一個麥克風俘獲的至少一個 音頻信號的方向性。
3. 根據權利要求2所述的方法,其中所述至少一個音頻信號包括話音信號。
4. 根據權利要求2所述的方法,其進一步包括顯示對應于所述至少一個音頻信號的圖 標。
5. 根據權利要求4所述的方法,其中顯示圖標進一步包括顯示用于目標音頻信號的圖 標及用于干擾音頻信號的圖標中的至少一者。
6. 根據權利要求1所述的方法,其進一步包括傳遞在所述至少一個扇區內指示的音頻 信號。
7. 根據權利要求1所述的方法,其進一步包括衰減未在所述至少一個扇區內指示的音 頻信號。
8. 根據權利要求1所述的方法,其進一步包括指示來自一或多個圖像傳感器的圖像數 據。
9. 根據權利要求1所述的方法,其進一步包括傳遞基于所述一或多個扇區的圖像數 據。
10. 根據權利要求1所述的方法,其中所述扇區選擇特征及所述扇區編輯特征中的至 少一者基于由單點觸摸輸入及多點觸摸輸入組成的群組中的至少一者而操作。
11. 根據權利要求1所述的方法,其進一步包括: 顯示對應于所述至少一個扇區的至少一個觸摸點; 接收對應于所述至少一個觸摸點的觸摸輸入;及 基于所述觸摸輸入來編輯所述至少一個扇區。
12. 根據權利要求1所述的方法,其進一步包括使所述用戶接口的至少一部分與參考 平面對準。
13. 根據權利要求12所述的方法,其中所述參考平面是水平的。
14. 根據權利要求12所述的方法,其中對準所述用戶接口的至少一部分包括將二維極 坐標圖映射到三維顯示空間中。
15. 根據權利要求1所述的方法,其中所述物理坐標是地球坐標。
16. 根據權利要求1所述的方法,其中所述物理坐標表示獨立于地球坐標的物理空間。
17. 根據權利要求1所述的方法,其中所述坐標系維持獨立于電子裝置定向的定向。
18. 根據權利要求1所述的方法,其進一步包括: 辨識音頻簽名; 在數據庫中查找所述音頻簽名; 獲得對應于所述音頻簽名的識別信息;及 在所述用戶接口上顯示所述識別信息。
19. 根據權利要求18所述的方法,其中所述識別信息是對應于所述音頻簽名的人的圖 像。
20. 根據權利要求1所述的方法,其進一步包括提供固定模式及可編輯模式。
21. 根據權利要求1所述的方法,其進一步包括填補所選擇的扇區。
22. 根據權利要求1所述的方法,其中所述扇區選擇特征使得能夠一次選擇多個扇區。
23. 根據權利要求1所述的方法,其中所述扇區編輯特征使得能夠基于單點或多點觸 摸輸入來調整所述扇區。
24. 根據權利要求1所述的方法,其中所述扇區選擇特征是基于一或多個滑動輸入。
25. 根據權利要求24所述的方法,其中所述一或多個滑動輸入指示圓形區。
26. 根據權利要求24所述的方法,其中所述一或多個滑動輸入是單一滑動。
27. -種電子裝置,其包括: 顯示器,其中所述顯示器呈現用戶接口,其中所述用戶接口包括坐標系,其中所述坐標 系基于傳感器數據而對應于物理坐標;所述顯示器提供允許選擇所述坐標系的至少一個扇 區的扇區選擇特征;且所述顯示器提供允許編輯所述至少一個扇區的扇區編輯特征。
28. 根據權利要求27所述的電子裝置,其中所述顯示器顯示由至少一個麥克風俘獲的 至少一個音頻信號的方向性。
29. 根據權利要求28所述的電子裝置,其中所述至少一個音頻信號包括話音信號。
30. 根據權利要求28所述的電子裝置,其中所述顯示器顯示對應于所述至少一個音頻 信號的圖標。
31. 根據權利要求30所述的電子裝置,其中顯示圖標進一步包括顯示用于目標音頻信 號的圖標及用于干擾音頻信號的圖標中的至少一者。
32. 根據權利要求27所述的電子裝置,其進一步包括耦合到所述顯示器的操作電路, 其中所述操作電路傳遞在所述至少一個扇區內指示的音頻信號。
33. 根據權利要求27所述的電子裝置,其進一步包括耦合到所述顯示器的操作電路, 其中所述操作電路衰減未在所述至少一個扇區內指示的音頻信號。
34. 根據權利要求27所述的電子裝置,其中所述顯示器指示來自一或多個圖像傳感器 的圖像數據。
35. 根據權利要求27所述的電子裝置,其進一步包括耦合到所述顯示器的操作電路, 其中所述操作電路傳遞基于所述一或多個扇區的圖像數據。
36. 根據權利要求27所述的電子裝置,其中所述扇區選擇特征及所述扇區編輯特征中 的至少一者基于由單點觸摸輸入及多點觸摸輸入組成的群組中的至少一者而操作。
37. 根據權利要求27所述的電子裝置,其中所述顯示器顯示對應于所述至少一個扇區 的至少一個觸摸點,且其中所述電子裝置進一步包括接收對應于所述至少一個觸摸點的觸 摸輸入的觸摸傳感器,且其中所述用戶接口基于所述觸摸輸入來編輯所述至少一個扇區。
38. 根據權利要求27所述的電子裝置,其中所述用戶接口使所述用戶接口的至少一部 分與參考平面對準。
39. 根據權利要求38所述的電子裝置,其中所述參考平面是水平的。
40. 根據權利要求38所述的電子裝置,其中對準所述用戶接口的至少一部分包括將二 維極坐標圖映射到三維顯示空間中。
41. 根據權利要求27所述的電子裝置,其中所述物理坐標是地球坐標。
42. 根據權利要求27所述的電子裝置,其中所述物理坐標表示獨立于地球坐標的物理 空間。
43. 根據權利要求27所述的電子裝置,其中所述坐標系維持獨立于電子裝置定向的定 向。
44. 根據權利要求27所述的電子裝置,其進一步包括音頻簽名辨識電路,所述音頻簽 名辨識電路:辨識音頻簽名;在數據庫中查找所述音頻簽名;獲得對應于所述音頻簽名的 識別信息;及將所述識別信息傳遞到所述顯示器。
45. 根據權利要求44所述的電子裝置,其中所述識別信息是對應于所述音頻簽名的人 的圖像。
46. 根據權利要求27所述的電子裝置,其中所述用戶接口提供固定模式及可編輯模 式。
47. 根據權利要求27所述的電子裝置,其中所述用戶接口填補所選擇的扇區。
48. 根據權利要求27所述的電子裝置,其中所述扇區選擇特征使得能夠一次選擇多個 扇區。
49. 根據權利要求27所述的電子裝置,其中所述扇區編輯特征使得能夠基于單點或多 點觸摸輸入來調整所述扇區。
50. 根據權利要求27所述的電子裝置,其中所述扇區選擇特征是基于一或多個滑動輸 入。
51. 根據權利要求50所述的電子裝置,其中所述一或多個滑動輸入指示圓形區。
52. 根據權利要求50所述的電子裝置,其中所述一或多個滑動輸入是單一滑動。
53. -種用于顯示用戶接口的計算機程序產品,其包括上面具有指令的非暫時性有形 計算機可讀媒體,所述指令包括: 用于致使電子裝置呈現用戶接口的代碼,其中所述用戶接口包括坐標系,其中所述坐 標系基于傳感器數據而對應于物理坐標; 用于致使所述電子裝置提供允許選擇所述坐標系的至少一個扇區的扇區選擇特征的 代碼;及 用于致使所述電子裝置提供允許編輯所述至少一個扇區的扇區編輯特征的代碼。
54. 根據權利要求53所述的計算機程序產品,其中所述指令進一步包括用于致使所述 電子裝置顯示由至少一個麥克風俘獲的至少一個音頻信號的方向性的代碼。
55. 根據權利要求53所述的計算機程序產品,其中所述指令進一步包括用于致使所述 電子裝置傳遞在所述至少一個扇區內指示的音頻信號的代碼。
56. 根據權利要求53所述的計算機程序產品,其中所述指令進一步包括用于致使所述 電子裝置衰減未在所述至少一個扇區內指示的音頻信號的代碼。
57. 根據權利要求53所述的計算機程序產品,其中所述扇區選擇特征及所述扇區編輯 特征中的至少一者基于由單點觸摸輸入及多點觸摸輸入組成的群組中的至少一者而操作。
58. 根據權利要求53所述的計算機程序產品,其中所述扇區選擇特征使得能夠一次選 擇多個扇區。
59. 根據權利要求53所述的計算機程序產品,其中所述扇區選擇特征是基于一或多個 滑動輸入。
60. -種用于顯示用戶接口的設備,其包括: 用于呈現用戶接口的裝置,其中所述用戶接口包括坐標系,其中所述坐標系基于傳感 器數據而對應于物理坐標; 用于提供允許選擇所述坐標系的至少一個扇區的扇區選擇特征的裝置;及 用于提供允許編輯所述至少一個扇區的扇區編輯特征的裝置。
61. 根據權利要求60所述的設備,其進一步包括用于顯示由至少一個麥克風俘獲的至 少一個音頻信號的方向性的裝置。
62. 根據權利要求60所述的設備,其進一步包括用于傳遞在所述至少一個扇區內指示 的音頻信號的裝置。
63. 根據權利要求60所述的設備,其進一步包括用于衰減未在所述至少一個扇區內指 示的音頻信號的裝置。
64. 根據權利要求60所述的設備,其中所述扇區選擇特征及所述扇區編輯特征中的至 少一者基于由單點觸摸輸入及多點觸摸輸入組成的群組中的至少一者而操作。
65. 根據權利要求60所述的設備,其中所述扇區選擇特征使得能夠一次選擇多個扇 區。
66. 根據權利要求60所述的設備,其中所述扇區選擇特征是基于一或多個滑動輸入。
【文檔編號】G01S15/87GK104246531SQ201380019519
【公開日】2014年12月24日 申請日期:2013年4月10日 優先權日:2012年4月13日
【發明者】金萊軒, E·維瑟, P·L·通, J·P·托曼, J·C·邵 申請人:高通股份有限公司