Vous manquez des opportunités de trading :
- Applications de trading gratuites
- Plus de 8 000 signaux à copier
- Actualités économiques pour explorer les marchés financiers
Inscription
Se connecter
Vous acceptez la politique du site Web et les conditions d'utilisation
Si vous n'avez pas de compte, veuillez vous inscrire
Cours 12: Analyse de Blob, Traitement d'Image Binaire, Théorème de Green, Dérivée et Intégrale
Cours 12: Analyse de Blob, Traitement d'Image Binaire, Théorème de Green, Dérivée et Intégrale
Dans cette conférence, le professeur aborde un éventail de sujets, notamment la propriété intellectuelle, les brevets, les marques de commerce et les techniques de traitement d'images pour la détection des contours. La conférence met l'accent sur l'importance de la précision en vision industrielle 2D et sur les défis de la détection des bords flous ou défocalisés. Le professeur couvre les méthodes de recherche des dérivées partielles mixtes, des laplaciens et de la détection des contours à l'aide d'une interpolation sous-pixel, ainsi que des techniques de compensation des biais et d'étalonnage correctionnel dans la recherche de pics. Dans l'ensemble, la conférence donne un aperçu complet de ces sujets et de leurs applications pratiques.
Dans cette conférence sur le traitement d'image, l'orateur discute de diverses méthodes pour éviter la quantification des directions de gradient et améliorer la précision dans la détermination de la position des bords. L'interpolation est suggérée comme méthode préférée par rapport aux tables de consultation et à la quantification pour une détermination plus précise de la direction du gradient. De plus, la fixation de la taille du pas avec un cercle et l'utilisation d'une analyse multi-échelle sont discutées comme méthodes alternatives de calcul du gradient. L'orateur explique également une approche itérative de la rotation d'une image pour réduire à zéro la composante y du gradient et introduit le concept d'accord pour la rotation selon des angles spéciaux. On rappelle aux élèves de commencer tôt le quiz car c'est plus de travail que le problème typique des devoirs.
Cours 13 : Détection, reconnaissance et détermination de la pose d'objets, PatQuick (brevet américain 7016539)
Cours 13 : Détection, reconnaissance et détermination de la pose d'objets, PatQuick (brevet américain 7016539)
La conférence se concentre sur la détection, la reconnaissance et la détermination de la pose d'objets, en mettant l'accent sur le brevet PatQuick (US 7,016,539). Le brevet vise à détecter et à déterminer la pose d'objets dans l'espace et offre une amélioration par rapport aux méthodes précédentes, en utilisant une représentation abstraite appelée modèle qui est comparée à une image d'exécution à différentes poses et rotations. Le brevet incorpore également une liste de degrés de liberté généralisés pour augmenter la précision et utilise un filtrage passe-bas et une détection des contours pour obtenir des points limites, reportant le seuillage jusqu'aux étapes finales. De plus, la conférence traite du processus de création de modèles à l'aide de la détection des contours et des sondes avec l'espacement et le contraste souhaités pour représenter ces modèles, expliquant l'importance de prendre en compte les degrés de liberté tels que la translation, la rotation, la mise à l'échelle et le rapport d'aspect, qui permettent des variations dans dimensions et perspectives des objets.
La vidéo traite des modèles de recherche hexagonaux utilisés pour une recherche translationnelle efficace et évolutive dans la détection d'objets, y compris la détection de pic et une solution pour détecter des objets adjacents. La vidéo traite également de PatQuick, un brevet permettant de déterminer la présence de motifs prédéterminés dans des images d'exécution et leur emplacement multidimensionnel. La méthode utilise des sondes et un gradient précalculé pour correspondre à la pose d'un objet, et l'intégration de la fonction de notation supprime les erreurs du résultat. La vidéo explore une méthode alternative pour déterminer les différences d'angle à l'aide de produits scalaires et met l'accent sur les subtilités des opérations multi-échelles et la sélection des sondes pour différentes granularités. La précision de la méthode est limitée par la quantification de l'espace de recherche.
Cours 14 : Inspection dans PatQuick, transformée de Hough, homographie, détermination de la position, multi-échelles
Cours 14 : Inspection dans PatQuick, transformée de Hough, homographie, détermination de la position, multi-échelles
Dans cette conférence, l'algorithme PatQuick est discuté, en mettant l'accent sur l'utilisation de sondes pour produire une fonction de notation dans un espace multidimensionnel, qui détermine la pose d'un objet dans des images en temps réel. La fonction de correspondance utilisée pour évaluer la qualité de la correspondance en termes de direction et d'amplitude du gradient est également examinée, avec différentes fonctions de notation discutées pour les compromis entre précision et vitesse. La conférence se penche également sur différentes méthodes utilisées pour rendre le processus de correspondance de motifs plus efficace, notamment en ajustant la granularité du calcul et en relevant le défi d'obtenir les bonnes directions, en particulier lors de l'exécution de transformations qui modifient le rapport d'aspect d'une image. La conférence aborde également le sujet de l'homographie et de la transformée de Hough pour détecter les lignes dans les photographies.
La conférence couvre une gamme de sujets liés à la vision par ordinateur, y compris la transformation de Hough, la demi-transformation de Gauss étendue, la détermination de position, le sous-échantillonnage multi-échelle et SIFT. La transformation de Hough est utilisée pour la détection de lignes et de bords, tandis que la demi-transformation de Gauss étendue est une version plus sophistiquée de la transformation de Hough. La conférence explique également comment utiliser la transformation de Hough pour détecter des cercles, tels que l'emplacement d'une tour de téléphonie cellulaire. De plus, le conférencier discute du sous-échantillonnage d'images pour réduire la charge de travail sans sacrifier la qualité, et présente SIFT, une méthode pour trouver des points correspondants dans différentes images d'une scène, qui est largement utilisée pour produire des informations 3D à partir de plusieurs images. Enfin, le conférencier aborde brièvement la théorie musicale et termine par un rappel de soumettre des propositions et une citation sur le fait de ne pas tarder.
Cours 15 : Alignement, PatMax, champ de distance, filtrage et sous-échantillonnage (brevet américain 7065262)
Cours 15 : Alignement, PatMax, champ de distance, filtrage et sous-échantillonnage (brevet américain 7065262)
La vidéo traite de plusieurs techniques et brevets liés à la reconnaissance de formes et à la détection d'objets. L'une de ces techniques est PatMax, qui améliore de manière itérative la pose d'une image d'exécution à l'aide d'un système attractif basé sur la force. Une autre technique consiste à générer un champ vectoriel sur une grille de pixels pour améliorer l'alignement de l'image d'exécution. Le cours couvre également l'utilisation des champs de distance pour la détection des bords et l'expansion des bords amorcés en examinant les vecteurs de force dans le champ vectoriel. Le conférencier discute également de l'utilisation de la correspondance de motifs à plusieurs échelles et des étapes mathématiques impliquées dans l'ajustement des lignes aux ensembles de coordonnées d'image. Enfin, un brevet pour calculer efficacement plusieurs échelles est introduit.
Dans la conférence 15, le conférencier couvre diverses techniques et raccourcis pour une convolution, un filtrage et un sous-échantillonnage efficaces des images. Celles-ci incluent l'approximation des noyaux de filtre à l'aide de polynômes splines par morceaux, l'utilisation de dérivés comme convolutions, la compression d'images en prenant à plusieurs reprises la troisième différence et la combinaison de convolutions dans les directions x et y. L'orateur mentionne également l'importance du filtrage passe-bas avant l'échantillonnage des images pour éviter les interférences et le crénelage dans les images.
Cours 16 : Convolution rapide, approximations de filtre passe-bas, images intégrales (brevet américain 6457032)
Cours 16 : Convolution rapide, approximations de filtre passe-bas, images intégrales (brevet américain 6457032)
La conférence couvre divers sujets liés au traitement du signal, notamment la limitation de bande, le repliement, les approximations de filtre passe-bas, le flou, l'image intégrale, l'analyse de Fourier et la convolution. L'orateur insiste sur l'importance du filtrage passe-bas des signaux avant l'échantillonnage pour éviter les artefacts de repliement. La conférence introduit également l'idée de l'image intégrale, qui calcule efficacement la somme des pixels dans un bloc, et diverses techniques pour réduire le calcul lors de l'approximation des filtres passe-bas. Enfin, la conférence traite de l'interpolation bicubique, qui est utilisée pour approximer la fonction sinc, et de ses coûts de calcul.
Dans cette conférence, le conférencier aborde divers sujets liés à la convolution, aux approximations de filtres passe-bas et aux images intégrales. Ils expliquent différentes implémentations de la convolution, y compris une méthode qui permet de gagner du temps de calcul en ajoutant des valeurs de gauche à droite et en soustrayant pour obtenir la moyenne. Les limites de l'interpolation linéaire pour les approximations de filtre passe-bas et son infériorité par rapport à des méthodes plus avancées comme l'interpolation cubique sont également discutées. Le concept d'un pilulier et sa valeur dans la limitation des plages de fréquences sont introduits, et l'orateur parle du filtre passe-bas idéal et de la façon dont la défocalisation affecte la fonction de Bessel. La conférence aborde également l'utilisation d'approximations de filtres passe-bas pour les objectifs d'appareils photo reflex numériques et le concept de photogrammétrie.
Cours 17 : Photogrammétrie, Orientation, Axes d'Inertie, Symétrie, Orientation
Cours 17 : Photogrammétrie, Orientation, Axes d'Inertie, Symétrie, Orientation
Cette conférence couvre divers sujets liés à la photogrammétrie, y compris les repères de profondeur, l'étalonnage de la caméra et l'établissement de la transformation entre deux systèmes de coordonnées. L'orateur explique comment aborder le problème de trouver la transformation de coordonnées entre deux systèmes en utilisant des mesures correspondantes et souligne l'importance de vérifier l'inverse exact de la transformation. Le cours traite également de la recherche des axes d'inertie dans l'espace 2D et 3D et de la détermination de la distance entre deux points projetés sur un axe. Dans l'ensemble, la section fournit un aperçu complet de la photogrammétrie et de ses applications.
La photogrammétrie nécessite de construire un système de coordonnées sur un nuage de points dans les systèmes de coordonnées gauche et droite et de relier les deux. L'enseignant explique comment déterminer la matrice d'inertie ou les axes d'inertie et établir les vecteurs de base. Ils discutent également des défis posés par les objets symétriques et des propriétés de rotation, telles que la préservation des produits scalaires, des longueurs et des angles. De plus, la conférence explique comment simplifier le problème de la recherche de rotation en éliminant la traduction et en minimisant le terme d'erreur. Enfin, l'enseignant explique comment aligner deux objets de formes similaires à l'aide du calcul vectoriel et suggère d'explorer d'autres représentations pour la rotation.
Cours 18 : La rotation et comment la représenter, les quaternions unitaires, l'espace des rotations
Cours 18 : La rotation et comment la représenter, les quaternions unitaires, l'espace des rotations
Cette conférence traite des défis de la représentation des rotations et présente l'utilité des quaternions de Hamilton. Les quaternions unitaires sont particulièrement utiles car ils correspondent directement aux rotations dans trois espaces, permettant une discussion sur un espace de rotation et d'optimisation dans cet espace. Les quaternions ont des propriétés similaires aux nombres complexes et sont particulièrement utiles pour représenter les rotations car ils préservent les produits scalaires, les produits triples, la longueur, les angles et la sensibilité. La conférence aborde également différentes méthodes de représentation de la rotation, l'importance de pouvoir faire pivoter des vecteurs et composer des rotations, et les limites des méthodes conventionnelles telles que les matrices, les angles d'Euler et le verrouillage du cardan. Enfin, la conférence présente les recherches en cours dans le domaine, notamment l'optimisation et l'ajustement des rotations aux modèles, et le développement de nouvelles méthodes d'analyse et de visualisation des espaces de rotation.
Dans cette conférence, le professeur discute du problème de trouver la transformation de coordonnées entre deux systèmes de coordonnées ou la meilleure rotation et translation entre deux objets avec des points correspondants mesurés dans les deux systèmes de coordonnées. La conférence explore l'utilisation des quaternions pour aligner les caméras des engins spatiaux avec les directions du catalogue et résoudre le problème de l'orientation relative. L'efficacité des quaternions dans la représentation des rotations est discutée, ainsi que différentes méthodes pour approcher la représentation des rotations dans un espace à quatre dimensions. De plus, la conférence explore divers groupes de rotation pour différents polyèdres, soulignant l'importance de sélectionner le système de coordonnées correct pour obtenir un échantillonnage spatial régulier.
Cours 19 : Orientation absolue sous forme fermée, valeurs aberrantes et robustesse, RANSAC
Cours 19 : Orientation absolue sous forme fermée, valeurs aberrantes et robustesse, RANSAC
La conférence couvre divers aspects de l'orientation absolue, notamment l'utilisation de quaternions unitaires pour représenter les rotations en photogrammétrie, la conversion entre les représentations quaternioniques et matricielles orthonormées, le traitement de la symétrie de rotation et la coordination de la traduction, de la mise à l'échelle et de la rotation sans correspondance. La conférence aborde également le problème des valeurs aberrantes et de la robustesse dans les processus d'ajustement et de mesure des lignes et présente la méthode RANSAC (Random Sample Consensus) comme moyen d'améliorer la fiabilité des mesures lorsque des valeurs aberrantes sont présentes. La conférence se termine par une discussion sur la résolution du problème d'orientation absolue sous forme fermée à l'aide de deux plans dans un scénario coplanaire, y compris les défis liés aux valeurs aberrantes et à l'optimisation.
Dans cette vidéo sur l'orientation absolue, le conférencier aborde la question des valeurs aberrantes dans les données réelles et propose l'utilisation de RANSAC, une méthode de consensus impliquant des ajustements aléatoires de sous-ensembles pour traiter les valeurs aberrantes. Le conférencier aborde également les méthodes permettant d'obtenir une distribution uniforme des points sur une sphère, notamment l'inscription d'une sphère dans un cube et la projection de points aléatoires, la mosaïque de la surface de la sphère et la génération de points sur des polyèdres réguliers. De plus, le conférencier couvre les moyens d'échantillonner l'espace des rotations pour une reconnaissance efficace de plusieurs objets dans une bibliothèque, de trouver le nombre de rotations nécessaires pour aligner un objet avec lui-même et d'aborder le problème de la recherche de rotations à travers des exemples ou la multiplication de quaternions.
MIT 6.801 Machine Vision, automne 2020. Conférence 20 : Espace de rotations, tessellations régulières, surfaces critiques, stéréo binoculaire
Cours 20 : Espace des rotations, pavages réguliers, surfaces critiques, stéréo binoculaire
Cette section de la conférence couvre des sujets tels que les pavages réguliers, les surfaces critiques, la stéréo binoculaire et la recherche des paramètres d'une transformation dans un espace tridimensionnel. Le conférencier explique que la meilleure façon de tesseller une sphère est d'utiliser le double d'une tessellation triangulaire, en créant des formes approximativement hexagonales avec quelques pentagones. Ils discutent également des surfaces critiques, qui sont difficiles pour la vision artificielle, mais peuvent être utilisées pour créer des meubles à partir de bâtons droits. Dans la discussion sur la stéréo binoculaire, le conférencier explique la relation entre deux caméras, le concept de lignes épipolaires et comment trouver l'intersection de deux caméras pour déterminer un point dans le monde. Ils expliquent également comment calculer l'erreur entre deux rayons pour déterminer leur intersection et minimiser l'erreur d'image tout en tenant compte du facteur de conversion entre erreur dans le monde et erreur dans l'image. Enfin, ils expliquent comment trouver la ligne de base et D pour récupérer la position et l'orientation d'un objet rigide dans l'espace en utilisant un quaternion pour représenter la ligne de base.
La conférence couvre divers sujets, notamment l'espace des rotations, les pavages réguliers, les surfaces critiques et la stéréo binoculaire. Pour les rotations, l'instructeur discute de l'utilisation des approches numériques, du problème des singularités et des avantages de l'utilisation des quaternions unitaires. Avec des pavages réguliers, ils montrent comment certaines surfaces peuvent causer des problèmes avec la stéréo binoculaire et suggèrent d'utiliser des mesures d'erreur et des poids pour atténuer les problèmes. L'orateur aborde également les surfaces quadriques et introduit un nouveau problème de devoir qui implique une "réflexion sans peur".
Cours 21 : Orientation relative, stéréo binoculaire, structure, quadrique, étalonnage, reproduction
Cours 21 : Orientation relative, stéréo binoculaire, structure, quadrique, étalonnage, reproduction
Cette conférence couvre des sujets liés à la photogrammétrie, notamment l'orientation relative, les surfaces quadriques, l'étalonnage de la caméra et les correspondances entre les points d'image et les objets 3D connus. Le conférencier explique diverses méthodes pour résoudre les problèmes de distorsion et obtenir des paramètres tels que f et tz. Ils soulignent également l'importance des vecteurs unitaires orthogonaux lors de la recherche de la matrice de rotation complète et fournissent des solutions pour trouver k en utilisant une formule plus stable. L'enseignant insiste sur l'importance de comprendre les équations homogènes, qui sont essentielles en vision artificielle.
Cette conférence couvre divers sujets liés à la vision par ordinateur et à l'étalonnage, notamment l'utilisation d'une cible plane pour l'étalonnage, l'ambiguïté de l'étalonnage de l'orientation extérieure, la redondance dans la représentation des paramètres de rotation et la détermination des propriétés statistiques de paramètres donnés par le rapport de gain de bruit. Le cours explique la formule de résolution d'une équation quadratique et introduit une méthode d'approximation par itération. Le cas de la cible plane est discuté comme une méthode couramment utilisée pour les applications d'étalonnage et de vision industrielle. La conférence aborde également la représentation de la forme et de la reconnaissance, ainsi que la détermination de l'attitude dans l'espace 3D.