머신러닝
- 음석인식 모델 개발
- 이미지인식 모델 개발
MACHINE LEARNING
머신러닝
음성 인식 모델 개발
음성인식 모델 훈련
- 1음성인식에 사용 될 음성 키워드 및 노이즈 음원을 준비
- 2머신러닝을 위한 음성 데이터 처리 및 특징 추출
- 3심층 분석을 통한 음성인식 모델 훈련
- 4음성인식 모델 검증
음성인식 향상을 위한 잔향 효과 처리
- 좁은 공간에서 반사되어 돌아오는 음성으로 인하여 음성 인식률은 현저하게 저하된다. 이와 같은 잔향 현상을 커버하기 위하여, RIR (Room Impulse Response) 기법으로 음성 데이터에 잔향 효과를 적용하였으며, 개방형 또는 밀폐형의 다양한 공간에서도 음성인식 기능을 수행하도록 머신러닝 모델에 반영.
페블스퀘어 음성인식 모델의 장점
기존 HMM(Hidden Markov Models) 기반 모델
-
현재의 음소를 기반으로 다음 음소를 추정
인식된 음소를 확률모델에 적용하여 다음 음소를 추측하는 인식방법
-
플래시 메모리의 저장능력 한계
학습에 필요로 하는 음소의 개수가 많아 메모리 사용량 증가
-
주변 노이즈에 취약
· 알고리즘 특성상 훈련된 음소와 노이즈 상황의실제 음소와의 차이가 존재
· 노이즈 상황에서 인식율의 현저한 저하
페블스퀘어 모델
-
신경망 학습을 통한 키워드 패턴 인식
· 신경망 학습을 통한 음성 키워드들의 특징 추출
· 자사 고유의 데이터 처리 방법을 통한 높은 음성인식 성능 구현 -
엣지 AI칩용 경량화 모델
· 경량화 모델 사용 및 자사 제작 엣지 AI칩을 통한 저전력/초소형 모듈
· 고성능 로컬 음성인식 시스템 -
노이즈 혼합 음성 훈련
· 일상 환경의 노이즈가 적용된 모델 개발로 높은 인식률 구현
·유사어 대응 및 구분 능력 -
다양한 환경에서의 적용
· 고객의 요구에 맞는 환경에서 적용 가능한 음성모델
· 높은 수준의 노이즈 강건성과 외부 음성 노이즈 구분 능력
MACHINE LEARNING
머신러닝
이미지 인식 모델 개발
이미지 인식 알고리즘 개발
- 로컬 이미지 인식을 위한 머신러닝 플로우 챠트
- 1인식하고자 하는 타겟 이미지 및 배경/유사 이미지의 데이터 베이스 구축
- 2컨볼루셔널 인공 신경망 (CNN) 알고리즘을 사용하여 이미지 처리 및 특징 맵 추출
- 3인공 신경망에서의 학습 및 클래스 분류
- 4타겟 이미지 식별 여부 검증
이미지 인식 향상을 위한 데이터 증강
- 원본 이미지의 RGB, 회전, 해상도, 위치변경 등의 다양한 방법으로 이미지 데이터의 양을 증강하여 넓은 범위의 타겟 이미지를 인식할 수 있도록 조정
- 이와 같은 방법으로 타겟 이미지의 인식 정확도를 높여 원하는 대상만을 포착할 수 있는 모델을 구축