Está perdiendo oportunidades comerciales:
- Aplicaciones de trading gratuitas
- 8 000+ señales para copiar
- Noticias económicas para analizar los mercados financieros
Registro
Entrada
Usted acepta la política del sitio web y las condiciones de uso
Si no tiene cuenta de usuario, regístrese
Lección 12: Análisis Blob, Procesamiento Binario de Imágenes, Teorema de Green, Derivada e Integral
Lección 12: Análisis Blob, Procesamiento Binario de Imágenes, Teorema de Green, Derivada e Integral
En esta conferencia, el profesor cubre una variedad de temas que incluyen propiedad intelectual, patentes, marcas registradas y técnicas de procesamiento de imágenes para la detección de bordes. La conferencia enfatiza la importancia de la precisión en la visión artificial 2D y los desafíos de detectar bordes borrosos o desenfocados. El profesor cubre métodos para encontrar derivadas parciales mixtas, laplacianos y detección de bordes mediante interpolación de subpíxeles, junto con técnicas para compensación de polarización y calibración correctiva en la búsqueda de picos. En general, la conferencia proporciona una visión general completa de estos temas y sus aplicaciones prácticas.
En esta lección sobre procesamiento de imágenes, el orador analiza varios métodos para evitar la cuantificación de las direcciones de gradiente y mejorar la precisión en la determinación de la posición del borde. Se sugiere la interpolación como método preferido sobre las tablas de búsqueda y la cuantificación para una determinación más precisa de la dirección del gradiente. Además, la fijación del tamaño de paso con un círculo y el uso de análisis multiescala se analizan como métodos alternativos de cálculo de gradiente. El orador también explica un enfoque iterativo para rotar una imagen para reducir el componente y del gradiente a cero e introduce el concepto de cuerda para rotar a través de ángulos especiales. Se les recuerda a los estudiantes que comiencen temprano en la prueba, ya que es más trabajo que el típico problema de tarea.
Clase 13: Detección de objetos, reconocimiento y determinación de poses, PatQuick (patente de US. 7016539)
Clase 13: Detección de objetos, reconocimiento y determinación de poses, PatQuick (patente de US. 7016539)
La conferencia se centra en la detección de objetos, el reconocimiento y la determinación de poses, con énfasis en la patente PatQuick (US 7,016,539). La patente tiene como objetivo detectar y determinar la pose de los objetos en el espacio y ofrece una mejora con respecto a los métodos anteriores, utilizando una representación abstracta llamada modelo que se compara con una imagen en tiempo de ejecución en diferentes poses y rotaciones. La patente también incorpora una lista de grados de libertad generalizados para aumentar la precisión y utiliza filtrado de paso bajo y detección de bordes para obtener puntos límite, posponiendo el umbral hasta las etapas finales. Además, la lección analiza el proceso de creación de modelos mediante la detección de bordes y sondas con el espaciado y el contraste deseados para representar estos modelos, explicando la importancia de considerar grados de libertad como traslación, rotación, escala y relación de aspecto, que permiten variaciones en dimensiones y perspectivas de los objetos.
El video analiza los patrones de búsqueda hexagonales utilizados para la búsqueda traslacional eficiente y escalable en la detección de objetos, incluida la detección de picos y una solución para detectar objetos adyacentes. El video también analiza PatQuick, una patente para determinar la presencia de patrones predeterminados en imágenes de tiempo de ejecución y su ubicación multidimensional. El método utiliza sondas y un gradiente calculado previamente para que coincida con la pose de un objeto, y la integración de la función de puntuación elimina los errores del resultado. El video explora un método alternativo para determinar las diferencias de ángulo utilizando productos de puntos y enfatiza las complejidades de las operaciones de múltiples escalas y la selección de sondas para diferentes granularidades. La precisión del método está limitada por la cuantificación del espacio de búsqueda.
Clase 14: Inspección en PatQuick, Transformada de Hough, Homografía, Determinación de Posición, Escala Múltiple
Clase 14: Inspección en PatQuick, Transformada de Hough, Homografía, Determinación de Posición, Escala Múltiple
En esta lección, se analiza el algoritmo PatQuick, centrándose en el uso de sondas para producir una función de puntuación en un espacio multidimensional, que determina la pose de un objeto en imágenes en tiempo real. También se examina la función de coincidencia utilizada para calificar la calidad de la coincidencia en términos de la dirección y la magnitud del gradiente, y se analizan diferentes funciones de puntuación para las compensaciones entre precisión y velocidad. La conferencia también profundiza en los diferentes métodos utilizados para hacer que el proceso de coincidencia de patrones sea más eficiente, incluido el ajuste de la granularidad del cálculo y el desafío de obtener las direcciones correctas, especialmente cuando se realizan transformaciones que cambian la relación de aspecto de una imagen. La conferencia también toca el tema de la homografía y la transformada de Hough para detectar líneas en fotografías.
La conferencia cubre una variedad de temas relacionados con la visión artificial, incluida la transformada de Hough, la semitransformada de Gauss extendida, la determinación de la posición, el submuestreo multiescala y SIFT. La transformada de Hough se utiliza para la detección de líneas y bordes, mientras que la transformada media de Gauss extendida es una versión más sofisticada de la transformada de Hough. La conferencia también explica cómo usar la Transformada de Hough para detectar círculos, como la ubicación de una torre de telefonía celular. Además, el orador analiza las imágenes de submuestreo para disminuir la carga de trabajo sin sacrificar la calidad y presenta SIFT, un método para encontrar puntos correspondientes en diferentes imágenes de una escena, que se usa ampliamente para producir información 3D a partir de múltiples imágenes. Finalmente, el orador discute brevemente la teoría musical y termina con un recordatorio para enviar propuestas y una cita sobre no demorar.
Clase 15: Alineación, PatMax, campo de distancia, filtrado y submuestreo (patente de US. 7065262)
Clase 15: Alineación, PatMax, campo de distancia, filtrado y submuestreo (patente de US. 7065262)
El video analiza varias técnicas y patentes relacionadas con el reconocimiento de patrones y la detección de objetos. Una de esas técnicas es PatMax, que mejora iterativamente la pose de una imagen en tiempo de ejecución mediante un atractivo sistema basado en la fuerza. Otra técnica consiste en generar un campo vectorial en una cuadrícula de píxeles para mejorar la alineación de la imagen en tiempo de ejecución. La conferencia también cubre el uso de campos de distancia para la detección de bordes y la expansión de bordes sembrados al observar los vectores de fuerza en el campo vectorial. El orador también analiza el uso de la coincidencia de patrones de múltiples escalas y los pasos matemáticos involucrados en el ajuste de líneas a conjuntos de coordenadas de imágenes. Finalmente, se presenta una patente para calcular múltiples escalas de manera eficiente.
En la lección 15, el disertante cubre varias técnicas y atajos para una convolución, filtrado y submuestreo eficientes de imágenes. Estos incluyen la aproximación de núcleos de filtro usando polinomios spline por partes, usando derivadas como convoluciones, comprimiendo imágenes tomando repetidamente la tercera diferencia y combinando las convoluciones de dirección x e y. El ponente también menciona la importancia del filtrado de paso bajo antes del muestreo de imágenes para evitar interferencias y aliasing en las imágenes.
Clase 16: Convolución rápida, aproximaciones de filtro de paso bajo, imágenes integrales (patente de US. 6457032)
Clase 16: Convolución rápida, aproximaciones de filtro de paso bajo, imágenes integrales (patente de US. 6457032)
La conferencia cubre varios temas relacionados con el procesamiento de señales, que incluyen limitación de banda, aliasing, aproximaciones de filtro de paso bajo, desenfoque, imagen integral, análisis de Fourier y convolución. El orador enfatiza la importancia del filtrado de paso bajo de las señales antes del muestreo para evitar artefactos de aliasing. La conferencia también presenta la idea de la imagen integral, que calcula de manera eficiente la suma de píxeles dentro de un bloque, y varias técnicas para reducir el cálculo al aproximar filtros de paso bajo. Por último, la lección analiza la interpolación bicúbica, que se utiliza para aproximar la función sinc, y sus costos computacionales.
En esta conferencia, el orador analiza varios temas relacionados con la convolución, las aproximaciones de filtros de paso bajo y las imágenes integrales. Explican diferentes implementaciones de convolución, incluido un método que ahorra tiempo de cálculo al sumar valores de izquierda a derecha y restar para obtener el promedio. También se analizan las limitaciones de la interpolación lineal para aproximaciones de filtros de paso bajo y su inferioridad en comparación con métodos más avanzados como la interpolación cúbica. Se presenta el concepto de pastillero y su valor para limitar los rangos de frecuencia, y el orador habla sobre el filtro de paso bajo ideal y cómo el desenfoque afecta la función de Bessel. La conferencia también aborda el uso de aproximaciones de filtros de paso bajo para lentes de cámaras DSLR y el concepto de fotogrametría.
Clase 17: Fotogrametría, Orientación, Ejes de Inercia, Simetría, Orientación
Clase 17: Fotogrametría, Orientación, Ejes de Inercia, Simetría, Orientación
Esta lección cubre varios temas relacionados con la fotogrametría, incluidas las señales de profundidad, la calibración de la cámara y el establecimiento de la transformación entre dos sistemas de coordenadas. El orador explica cómo abordar el problema de encontrar la transformación de coordenadas entre dos sistemas utilizando medidas correspondientes y destaca la importancia de comprobar la inversa exacta de la transformación. La lección también analiza cómo encontrar los ejes de inercia en el espacio 2D y 3D y cómo determinar la distancia entre dos puntos proyectados en un eje. En general, la sección proporciona una descripción completa de la fotogrametría y sus aplicaciones.
La fotogrametría requiere construir un sistema de coordenadas en una nube de puntos en sistemas de coordenadas de mano izquierda y derecha y relacionar los dos. El profesor explica cómo determinar la matriz de inercia o los ejes de inercia y establecer los vectores base. También analizan los desafíos que plantean los objetos simétricos y las propiedades de la rotación, como la preservación de los productos escalares, las longitudes y los ángulos. Además, la lección cubre cómo simplificar el problema de encontrar la rotación eliminando la traducción y minimizando el término de error. Finalmente, el disertante explica cómo alinear dos objetos con formas similares usando cálculo vectorial y sugiere explorar otras representaciones para la rotación.
Lección 18: La rotación y cómo representarla, los cuaterniones unitarios, el espacio de las rotaciones
Lección 18: La rotación y cómo representarla, los cuaterniones unitarios, el espacio de las rotaciones
Esta lección analiza los desafíos de representar rotaciones y presenta la utilidad de los cuaterniones de Hamilton. Los cuaterniones unitarios son particularmente útiles ya que se asignan directamente a rotaciones en tres espacios, lo que permite una discusión sobre un espacio de rotación y optimización en ese espacio. Los cuaterniones tienen propiedades similares a los números complejos y son particularmente útiles para representar rotaciones, ya que conservan los productos escalares, los productos triples, la longitud, los ángulos y la lateralidad. La conferencia también analiza diferentes métodos para representar la rotación, la importancia de poder rotar vectores y componer rotaciones, y las limitaciones de los métodos convencionales como las matrices, los ángulos de Euler y el bloqueo de cardán. Finalmente, la conferencia presenta investigaciones en curso en el campo, incluida la optimización y ajuste de rotaciones a modelos, y el desarrollo de nuevos métodos para analizar y visualizar espacios de rotación.
En esta conferencia, el profesor analiza el problema de encontrar la transformación de coordenadas entre dos sistemas de coordenadas o la mejor rotación y traslación entre dos objetos con puntos correspondientes medidos en los dos sistemas de coordenadas. La conferencia explora el uso de cuaterniones para alinear cámaras de naves espaciales con direcciones de catálogo y resolver el problema de la orientación relativa. Se discute la eficiencia de los cuaterniones para representar rotaciones, así como diferentes métodos para abordar la representación de rotaciones en un espacio de cuatro dimensiones. Además, la conferencia explora varios grupos de rotación para diferentes poliedros, enfatizando la importancia de seleccionar el sistema de coordenadas correcto para lograr un muestreo espacial regular.
Clase 19: Orientación Absoluta en Forma Cerrada, Outliers y Robustez, RANSAC
Clase 19: Orientación Absoluta en Forma Cerrada, Outliers y Robustez, RANSAC
La conferencia cubre varios aspectos de la orientación absoluta, incluido el uso de cuaterniones unitarios para representar rotaciones en fotogrametría, conversión entre cuaterniones y representaciones de matrices ortonormales, manejo de simetría de rotación y coordinación de traslación, escala y rotación sin correspondencia. La conferencia también analiza el problema de los valores atípicos y la robustez en los procesos de medición y ajuste de línea e introduce el método RANSAC (Random Sample Consensus) como una forma de mejorar la confiabilidad de las mediciones cuando hay valores atípicos. La conferencia concluye con una discusión sobre cómo resolver el problema de la orientación absoluta en forma cerrada utilizando dos planos en un escenario coplanar, incluidos los desafíos relacionados con los valores atípicos y la optimización.
En este video sobre orientación absoluta, el disertante analiza el tema de los valores atípicos en datos reales y propone el uso de RANSAC, un método de consenso que involucra ajustes aleatorios de subconjuntos para tratar los valores atípicos. El disertante también analiza métodos para lograr una distribución uniforme de puntos en una esfera, incluida la inscripción de una esfera en un cubo y la proyección de puntos aleatorios, la creación de mosaicos en la superficie de la esfera y la generación de puntos en poliedros regulares. Además, el disertante cubre formas de muestrear el espacio de rotaciones para el reconocimiento eficiente de múltiples objetos en una biblioteca, encontrar la cantidad de rotaciones necesarias para alinear un objeto consigo mismo y abordar el problema de encontrar rotaciones a través de ejemplos o multiplicación de cuaterniones.
MIT 6.801 Visión artificial, otoño de 2020. Clase 20: Espacio de rotaciones, teselaciones regulares, superficies críticas, estéreo binocular
Clase 20: Espacio de Rotaciones, Teselaciones Regulares, Superficies Críticas, Estéreo Binocular
Esta sección de la conferencia cubre temas que incluyen teselaciones regulares, superficies críticas, estéreo binocular y encontrar los parámetros de una transformación en el espacio tridimensional. El disertante explica que la mejor manera de teselar una esfera es usando el dual de un teselado triangular, creando formas aproximadamente hexagonales con algunos pentágonos. También analizan las superficies críticas, que son difíciles para la visión artificial, pero que se pueden usar para crear muebles con palos rectos. En la discusión del estéreo binocular, el disertante explica la relación entre dos cámaras, el concepto de líneas epipolares y cómo encontrar la intersección de dos cámaras para determinar un punto en el mundo. También explican cómo calcular el error entre dos rayos para determinar su intersección y minimizar el error de imagen teniendo en cuenta el factor de conversión entre error en el mundo y error en la imagen. Finalmente, discuten cómo encontrar la línea base y D para recuperar la posición y orientación de un objeto rígido en el espacio usando un cuaternión para representar la línea base.
La conferencia cubre varios temas, incluido el espacio de rotaciones, teselaciones regulares, superficies críticas y estéreo binocular. Para las rotaciones, el instructor analiza el uso de enfoques numéricos, el problema de las singularidades y los beneficios de usar cuaterniones unitarios. Con teselaciones regulares, muestran cómo ciertas superficies pueden causar problemas con el estéreo binocular y sugieren usar medidas y pesos de error para mitigar los problemas. El orador también toca las superficies cuádricas e introduce un nuevo problema de tarea que implica una "reflexión intrépida".
Clase 21: Orientación Relativa, Estéreo Binocular, Estructura, Cuádrica, Calibración, Reproyección
Clase 21: Orientación Relativa, Estéreo Binocular, Estructura, Cuádrica, Calibración, Reproyección
Esta lección cubre temas relacionados con la fotogrametría, incluida la orientación relativa, las superficies cuadráticas, la calibración de la cámara y las correspondencias entre los puntos de la imagen y los objetos 3D conocidos. El profesor explica varios métodos para resolver problemas de distorsión y obtención de parámetros como f y tz. También enfatizan la importancia de los vectores unitarios ortogonales al encontrar la matriz rotacional completa y brindan soluciones para encontrar k usando una fórmula más estable. El disertante enfatiza la importancia de entender las ecuaciones homogéneas, las cuales son críticas en la visión artificial.
Esta lección cubre varios temas relacionados con la visión artificial y la calibración, incluido el uso de un objetivo plano para la calibración, la ambigüedad de calibrar la orientación exterior, la redundancia en la representación de los parámetros de rotación y la determinación de las propiedades estadísticas de determinados parámetros a través de la relación de ganancia de ruido. La lección explica la fórmula para resolver una ecuación cuadrática e introduce un método de aproximación que involucra la iteración. El caso de objetivo planar se analiza como un método comúnmente utilizado para aplicaciones de calibración y visión artificial. La conferencia también toca la representación de la forma y el reconocimiento, y la determinación de la actitud en el espacio 3D.