1. Giới thiệu về thuật tân oán HOG

1.1. Giới thiệu chung

Có rất nhiều các phương pháp không giống nhau vào computer vision. khi phân một số loại hình họa, chúng ta có thể vận dụng bọn họ những mô hình CNN (Inception Net, Mobile Net, Resnet, Dense Net, Alexnet, Unet,…) và lúc phân phát hiện nay đồ dùng thể là các quy mô YOLO, SSD, Faster RCNN, Fast RCNN, Mask RCNN.

Bạn đang xem: Hog là gì

Các thuật toán kể trên phần lớn là đầy đủ mô hình deep learning. Vậy trước lúc deep learning bùng nổ, thuật tân oán nào thường xuyên được sử dụng trong giải pháp xử lý ảnh? Bài lúc này chúng ta sẽ kiếm tìm hểu về thuật toán Mặc dù cổ xưa dẫu vậy cũng rất hiệu quả trong xử lý ảnh, kia chính là HOG (histogram of oriented gradient).

Thuật toán thù này sẽ tạo nên ra các bộ thể hiện đặc trưng (feature descriptor) nhằm mục tiêu mục tiêu vạc hiện tại đồ vật thể (object detection). Từ một tấm hình, ta đã lôi ra 2 ma trận quan trọng đặc biệt giúp lưu thông tin ảnh đó là độ to gradient (gradient magnitute) với pmùi hương của gradient (gradient orientation). Bằng phương pháp phối kết hợp 2 đọc tin này vào một biểu thiết bị phân phối hận histogram, trong đó độ mập gradient được đếm theo các nhóm bins của pmùi hương gradient. Cuối thuộc ta đang chiếm được véc tơ đặc thù HOG đại diện đến histogram. Sơ knhị là vậy, trên thực tiễn thuật toán còn chuyển động tinh vi rộng Lúc véc tơ HOG sẽ tiến hành tính trên từng vùng chũm cỗ nlỗi mạng CNN cùng tiếp nối là phnghiền chuẩn chỉnh hóa rứa bộ để đồng điệu độ đo. Cuối cùng véc tơ HOG tổng hợp tự các véc tơ bên trên vùng tổng thể.

Trên đây là toàn cục giải thích vắn tắt về nguyên lý hoạt động vui chơi của HOG. Có thể vẫn tương đối cực nhọc phát âm cùng với độc giả thuở đầu mà lại đừng lo ngại. Chúng ta đang biệt lập sau thời điểm phát âm chương 2 giải thích chi tiết về thuật toán HOG.

1.2. Ứng dụng của HOG

Vậy HOG bao gồm ứng dụng cụ thể như thế nào? Một số tác vụ vẫn áp dụng HOG với mang lại độ chuẩn xác cao có thể kể tới là:

Nhận diện khuôn khía cạnh (face detection): Thường bọn họ đã nghĩ tức thì cho thuật tân oán Haar Cascde Classifier. Tuy nhiên HOG cũng là 1 thuật toán rất tác dụng được vận dụng vào bài tân oán này. Bởi nó có khả năng màn biểu diễn các con đường đường nét bao gồm của khuôn mặt dựa vào phương thơm với độ bự gradient trải qua các véc tơ trên từng cell như hình biểu thị mặt dưới:

*

Nhận diện những đồ vật thể khác: Hình như còn tương đối nhiều các trường hòa hợp nhận diện thứ thể trên ảnh tĩnh nlỗi phương tiện đi lại, biểu lộ giao thông, động vật hoặc thậm chỉ với hình họa hễ trường đoản cú đoạn Clip.

Tạo feature cho những bài bác toán thù phân loại ảnh: hầu hết bài xích toán phân loại hình ảnh được desgin bên trên một bộ dữ liệu form size nhỏ dại thì áp dụng những mạng học tập sâu chưa vững chắc vẫn mang về tác dụng cùng dễ dẫn đến overfiting. Nguyên nhân vày tài liệu ít hay không đủ để đào tạo và huấn luyện đến máy tính nhấn giỏi những đặc thù của thiết bị thể. Lúc kia áp dụng HOG nhằm tạo đặc thù đang mang đến tác dụng tốt hơn. Cụ thể tôi cũng trở nên thực hiện một ví dụ nghỉ ngơi cuối.

1.3. Thuật ngữ

Trước Khi tìm hiểu thuật toán HOG, tôi đã phân tích và lý giải trước những thuật ngữ được sử dụng:

Feature Descriptor: Sở biểu lộ đặc trưng, là một trong phép biến hóa dữ liệu thành các đặc trưng mang lại lợi ích mang lại phân nhiều loại hoặc thừa nhận diện vật thể. Các phương pháp có thể kể đến như HOG, SUFT, SHIFT.

Gradient: Là đạo hàm của véc tơ độ mạnh Color góp phát hiện nay phía di chuyển của những thứ thể trong hình hình ảnh.

Xem thêm: Thủy Tinh Hữu Cơ Là Gì ? Thủy Tinh Plexiglas Và Các Ứng Dụng

Local cell: Ô toàn cục. Trong thuật toán HOG, một hình hình ảnh được chia thành nhiều cells bởi một lưới ô vuông. Mỗi cell được call là một ô toàn thể.

Local portion: Vùng toàn thể. Là một vùng trước trích suất ra tự ô vuông trên hình hình họa. Trong phần trình bày về thuật toán thì vùng cục bộ còn gọi là bloông chồng.

Local normalization: Phxay chuẩn hóa được tiến hành trên một vùng cục bộ. Thường là phân chia đến norm chuẩn bậc 2 hoặc norm chuẩn chỉnh bậc 1. Mục đích của vấn đề chuẩn chỉnh hóa là nhằm nhất quán các quý giá cường độ Color về chung một phân phối. Ta đang làm rõ hơn trong phần trình bày thuật toán.

gradient direction: Phương thơm gradient. Là độ to góc giữa véc tơ gradient $x$ cùng $y$ giúp xác định pmùi hương thay đổi độ mạnh màu sắc tốt đó là pmùi hương đổ trơn của hình ảnh. Giả sử $G_x, G_y$ theo lần lượt là quý hiếm gradient theo lần lượt phương $x$ và $y$ của hình ảnh. Lúc kia pmùi hương gradient được tính nlỗi sau:

< heta = extacrtan(fracG_yG_x)> gradient magnitude: Độ phệ gradient. Là chiều dài của véc tơ gradient theo pmùi hương $x$ và phương $y$. Biểu diễn phân pân hận histogram của véc tơ này theo véc tơ pmùi hương gradient vẫn nhận được véc tơ bộc lộ đặc trưng HOG. Độ to gradient được xem nlỗi sau:<|G| = sqrtG_x^2+G_y^2>2. Lý thuyết về HOG

Điểm chủ yếu trong nguyên tắc hoạt động vui chơi của HOG sẽ là bản thiết kế của một đồ dùng thể toàn cục hoàn toàn có thể được diễn tả trải qua nhị ma trận sẽ là ma trận độ phệ gradient (gradient magnitude) và ma trận phương thơm gradient (gradient direction). Vậy 2 ma trận gradient trên được tạo thành như thế nào? Trước tiên hình hình ảnh được phân thành 1 lưới ô vuông cùng bên trên kia họ xác minh không ít các vùng tổng thể gần kề hoặc chồng lấn lên nhau. Các vùng này tương tự như như các vùng hình ảnh toàn bộ mà họ tính tích chập trong thuật toán thù CNN. Một vùng cục bộ bao hàm những ô toàn bộ (vào thuật tân oán HOG là 4) bao gồm kích thước là 8x8 pixels. Sau đó, một biểu vật dụng histogram thống kê lại độ phệ gradient được xem tân oán trên mỗi ô tổng thể mà lại họ sẽ khám phá tại phần 2.1 cách thức tính. Bộ thể hiện HOG (HOG descriptor) được chế tác thành bằng cách nối liền (concatenate) 4 véc tơ histogram ứng cùng với từng ô thành một véc tơ tổng đúng theo. Để nâng cấp độ đúng mực, mỗi cực hiếm của véc tơ histogram bên trên vùng toàn cục sẽ tiến hành chuẩn hóa theo norm chuẩn bậc 2 hoặc bậc 1 (ví dụ hơn đang giải thích mục 2.một bên dưới). Phép chuẩn chỉnh hóa này nhằm mục tiêu tạo ra sự không bao giờ thay đổi tốt hơn so với những biến hóa vào phát sáng cùng đổ trơn.

Bộ biểu hiện HOG tất cả một vài ưu thế chủ yếu đối với các bộ biểu đạt khác. Vì nó vận động trên các ô cục bộ, nó không bao giờ thay đổi đối với những phnghiền thay đổi hình học tập, biến đổi độ sáng. Nhiều hơn, như Dalal cùng Triggs đã vạc hiện ra, Lúc thực hiện phnghiền chuẩn chỉnh hóa bên trên vùng tổng thể đã có thể chấp nhận được chuyển động khung người của tín đồ đi dạo được thải trừ miễn sao họ bảo trì được tứ nỗ lực đứng thẳng. Do kia, cỗ miêu tả HOG đặc biệt tương xứng nhằm phát hiện nay nhỏ người vào hình hình họa.

2.1. Thuật toán HOG

2.1.1. Tính toán gradient

Trong đa số những thuật tân oán giải pháp xử lý hình ảnh, bước thứ nhất là chi phí giải pháp xử lý dữ liệu hình họa (pre-processing image). Chúng ta đang phải chuẩn hóa Màu sắc với cực hiếm gamma. Tuy nhiên, bước này rất có thể được bỏ lỡ trong phần tính toán bộ thể hiện HOG, bởi vì vấn đề chuẩn chỉnh hóa bộ diễn đạt ở bước tiếp theo đã có được kết quả tựa như. Ttuyệt vào kia, tại bước thứ nhất của tính toán cỗ biểu đạt chúng ta sẽ tính những quý giá gradient. Phương thơm pháp thông dụng độc nhất là vận dụng một phương diện nạ đạo hàm tách rốc (discrete derivative mask) theo một hoặc cả hai chiều ngang với dọc. Cụ thể, phương thức đang lọc ma trận độ mạnh hình ảnh với các bộ thanh lọc như Sobel mask hoặc scharr.

Để tính bộ thanh lọc sobel, phxay tích chập của kernel form size $3x3$ được tiến hành cùng với hình hình ảnh lúc đầu. Nếu bọn họ kí hiệu $mathbfI$ là ma trận ảnh gốc và $G_x, G_y$ là 2 ma trận ảnh mà lại từng điểm trên nó theo lần lượt là đạo hàm theo trục $x$ trục $y$. Chúng ta hoàn toàn có thể tính toán thù được kernel như sau:

Đạo hàm theo hướng ngang: Đạo hàm theo hướng dọc:

Kí hiệu * tương tự như nlỗi phép tích chập thân bộ lọc phía trái với ảnh đầu vào bên đề nghị.

Gía trị độ phệ gradient (gradient magnitude) cùng pmùi hương gradient (gradient direction) hoàn toàn có thể được tạo thành tự 2 đạo hàm $G_x$ và $G_y$ theo bí quyết bên dưới:

Độ mập gradient Phương thơm gradient:< heta = extacrtan(fracG_yG_x)>

Bây Giờ, gradient được tính khá thuận tiện trên thư viện sklearn hoặc OpenCV:

Bài viết liên quan

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *