
Non, l'interface tactile, fort bien exploitée par le iPhone d'Apple, n'est pas l'alpha et l'oméga de l'interaction. Les chercheurs en IHM (interaction homme-machine) ont d'autres fers au feu, parmi lesquels la vision artificielle (vision par ordinateur, « Computer Vision » en anglais), qui a plus d'une corde à son arc : détection et suivi de repères, d'outils, du doigt, de la main, interprétation de gestes, reconnaissance de visage, voire d'expressions faciales, suivi du regard, et j'en passe. Et ça bouge, dans la vision, en ce moment.
Commençons par cette vidéo qui circule depuis peu, dans laquelle la jeune société CamSpace démontre son savoir faire. En deux mots, elle applique au jeu vidéo l'excellent logiciel de vision de son actionnaire Cam-Trax. Celui-ci rend inutile la célèbre zapette à tout faire de la console de jeux Wii (Nintendo), car il est capable de pister en 3D, via une webcam ordinaire, jusqu'à quatre objets qui jouent illico le rôle d'un accessoire de jeu : un stylo sert de manche à balai, un livre devient raquette de ping-pong. Cam-Trax, c'est essentiellement Yaron Tanne, qui aurait développé pratiquement seul le logiciel dans son appartement de Tel Aviv, selon TechCrunh.
Toujours en Israël, en plein désert du Néguev, une équipe de chercheurs de l'Université Ben Gourion, dirigée par Juan Wachs, a développé un logiciel qui permet à des chirurgiens de manipuler des images sur un écran géant, en salle d'opération. Comme son nom l'indique, Gestix détecte la main et interprète des gestes, qui permettent de passer d'une image à l'autre, de zoomer… Tout cela sans contact, et c'est heureux, car un chirurgien en action porte des gants chirurgicaux stériles, possiblement maculés de sang.
Repérer un visage, c'est encore plus difficile, mais l'équipe PCR (Perception for Computers and Robots) dirigée par Luis Baumela à l'Université polytechnique de Madrid sait y faire. Mieux, elle est l'une des rares à interpréter les expressions faciales. Surprise, peur, joie, tristesse, dégoût, colère : ces six dimensions de nos états d'âme sont évalués en temps réel, à trente images par seconde.
D'acteur à créature numérique
Pour illustrer ce dont est capable aujourd'hui la vision par ordinateur, il y a enfin le dernier cri en matière de « capture de mouvements » (motion capture). Vous savez, cette technique qui permet de faire jouer par un acteur le rôle d'un héros de jeu vidéo ou de film en images de synthèse. Au final, c'est une créature numérique que l'on voit s'agiter à l'écran, mais si la gestuelle semble naturelle, c'est parce qu'elle a été « capturée » en filmant un acteur. Lequel, habituellement, est bardé de taches blanches, qui servent de repères aux algorithmes.
C'était hier, parce qu'aujourd'hui on sait le faire sans les taches. La société Image Metrics (Manchester, GB, et Santa Monica, Californie), comme nous le disions ici, est la première à proposer le motion capture sans tache : jouez devant la caméra, notre logiciel remplacera l'acteur par n'importe quelle créature. Car il voit, repère dans l'espace chaque mouvement de son corps, de son visage, de ses lèvres, de ses paupières…
Dans peu de temps, la majorité de nos PC seront dotés d'un œil. Dès lors, les logiciels qui voient et interprètent pourront s'en donner à cœur joie. Parions que l'avenir de l'interaction passe aussi par la vision.
En partenariat avec :





















30
(Pour réagir, connectez-vous)
De hillson
Master Métiers du conseil, Montpell... | 11H43 | 19/06/2008 |
C'est un peu une évolution de l'eye toy en fait… disponible depuis 2003 ?
à hillson
De rilax13
10H43 | 20/06/2008 |
En fait ce qu'ils font c'est sympa, certes, pas révolutionnaire non plus. C'est plutôt basique au niveau des interactions, une manette a des fonctionnalités plus subtiles.. : ] mais si on veut rendre compte de fonctionnement et d'interaction simple, là effectivement c'est intéressant. mais ce n'est ni plus ni moins que du motion tracking, sur un objet tenu par un humain. c'est au point depuis longtemps, ça sert à votre insu dans les halls d'aéroports pour suivre les mouvements suspects, un individu dans une foule, des voitures sur l'autoroute etc.
L'auteur parle des émotions reconnus par l'ordinateur, alors tout d'abord ce n'est pas au point, le système d'apprentissage est complètement biaisé, ça reconnait dans les 70-80% de façon juste une émotion dite simple.Or le visage humain exprime beaucoup plus d'émotions, et dès qu'ils augmentent le nombre d'émotions à analyser, ils ne reconnaissent plus rien du tout.
Pour revenir au sujet principal une partie de notre activité et des interactions passeront par le mouvement, certes, mais c'est pénible en terme d'effort toute personne qui joue à la wii pendant 2h vous le confirmera.. un « gamer » joue dans les 4-h par jours, et des mouvements de bras ou de jambes risquent de rapidement l'agacer et reviendra à des interactions moins fatigantes..
(je suis ergonome cogniticien spécialisé dans les interaction homme machine.. IHM, pour dire qu'en france aussi on réfléchi à tout ça : ] )
De VinceDeg
étudiant | vincedeg.nolizard.org | 12H01 | 19/06/2008 |
Halte à ces technologies qui bouleversent l'ordre naturel des choses : http://www.bouletcorp.com/blog/index.php ? date=20080525 ! !
à VinceDeg
De anti_cons
12H05 | 19/06/2008 |
ca me fait marrer ca,« l'ordre naturel des choses » ca veut dire quoi ca ? c limite extrême droite dit comme ca mais j'imagine que c'est tout simplement mal dit..
va te battre si tu veux changer le monde mon vieux ! ! Et pas contre des createurs de consoles c'est pas les plus dangereux !
à anti_cons
De gsourima
13H10 | 19/06/2008 |
cf le strip de boulet…
Second degré anti_cons, second degré…
; -)
à anti_cons
De VinceDeg
étudiant | vincedeg.nolizard.org | 13H21 | 19/06/2008 |
Gsourima a tout dit, clique sur le lien, c'est rigolo, ça s'appelle de l'humour (en bd).
En résumé, la thèse de M. Boulet est que la caste sociale des « geeks » va prendre un ascendant dangereux et sans précédent sur les autres castes grâce aux nouveaux superpouvoirs acquis lors de l'utilisation de ces nouvelles technologies ; -)
à VinceDeg
De anti_cons
15H18 | 19/06/2008 |
ha exact a la vue du message j'avais meme pas cliqué sur le lien ; )
De anti_cons
12H03 | 19/06/2008 |
Hé bé !
quel genre de jeux on va faire avec ca ? le tennis avec un livre ds la main ? Sourire ou chialer voir si la console reconnait notre humeur ? mouais, je reste sur pes et gta !
De PetitPiteux
12H23 | 19/06/2008 |
dingue ! un article sur la vision par ordinateur/l'ia à peut près mesuré et informé, qui ne clame pas à la lune quand on n'a qu'un doigt qui la montre…
Il se peut, finalement, que les journalistes aient une utilité : )…
De Sir_galaad
Un clavier AZERTY en vaut deux ... | 12H41 | 19/06/2008 |
Je suis content d'apprendre que je pourrait jouer au ping-pong sur mon pc grâce a mon petit livre rouge ! ! !
Merci la technologie : -)
De screugneugneux
râleur-NRV | 12H49 | 19/06/2008 |
ici on nous parle des application ludiques, c'est pas les plus effrayantes,
moi ce qui me fait carrément flipper c'est les possibilitées de surveillance de masse que ces dispositifs permettent, je n'es imagine même pas l'étendue…………
sourriez, vous êtes observé, analysé, décortiqué, déshumanisé….
De 23jfk
casse-couilles | 12H56 | 19/06/2008 |
C'est un peu de l'arnaque intelectuelle là, étant donné qu'il s'agit plus de reconnaissance par des couleurs que par des formes, bref cette technologie ne reconnaîtra jamais un visage les autres jours que mardi gras
à 23jfk
De gsourima
13H04 | 19/06/2008 |
Pour l'appli Cam-Trax : oui. Mais à priori elle est basée sur des techniques et algos qui ont eu le temps de murir depuis qu'ils existent : à savoir un bon paquet d'années.
L'état de la recherche sur le sujet est actuellement bien plus évoluée, mais pas assez mûre pour générer des applis grand public.
De dismantr
14H13 | 19/06/2008 |
C'est en gros comme toute technologie : bien employée, elle fait toujours des miracles, mais nous [les Humains] savons merveilleusement bien détourner les avancées de leurs destins premiers…
Personnellement, j'ai hâte que des algorithmes de ce genre mûrisse en open-source, et particulièrement sur Linux, pour que je puisse utiliser certaines gestuelles pour commander mon PC, voire des éléments domotiques dans mon futur chez moi : -) (par exemple (un coup de bras vers le bas en direction de la fenêtre pour fermer le volet : -) hihi)…
Évidemment, les possibilités de dérives sont grandes… C'est pourquoi j'ai foi dans les technologies ouvertes, et pas dans les softs intrusifs dont on ne contrôle pas le contenu et l'activité…
à dismantr
De rilax13
14H57 | 19/06/2008 |
ça existe, il y a des plugins qui suivent le mouvement de la souris, une croix cela ferme l'appli, un mouvement vers le bas la rétrécie etc..
De adaunis
Nul part....si adelyne me plaque...... | 14H52 | 19/06/2008 |
Passionné de technologies nouvelles depuis l'enfance, déjà à l'époque, la tête dans les étoiles, « béotien » permanent depuis, je vais apporter ma petite contribution à ce sujet, qui m'apparait être plutôt l'apanage des spécialistes.
Dans les années 70, « baguenaudant » devant un magasin de la Rue St Jacques, spécialisé en technologies, et présentant les premiers ordinateurs, je m'étais aventuré à y pénétré, et interroger les vendeurs très peu occupés, faute de clients, sur ce « matériel » !
J'avais expliqué à l'un d'entre eux, que je serai intéressé un peu plus tard, quand je ne serai pas astreint à taper sur un clavier, (comme à la machine par flemme déjà), et que ça m'intéresserai quand il y aurait une « reconnaissance vocale » qui ferait le travail pour moi !
Stupeur et regard « compatissant » du « personnel » présent !
Plus de trente ans plus tard, j'ai un logiciel de « reconnaissance », qui fonctionne superbement pour mes travaux personnels, (car j'écris d'abord avec un stylo ou enregistre mes idées), et mon rêve s'est réalisé.
De plus, j'ai appris à taper comme une dactylo, cela mis à part.
Bref, ces avancées technologiques me font toujours rêver, et font briller ce qu'il me reste de mon âme d'enfant, dans ce monde de « brutes » !
De elLolo
15H13 | 19/06/2008 |
« Les chercheurs en IHM (interaction homme-machine) »… Aïe ! IHM veut dire Interface Homme-Machine (en anglais : GUI, Graphical User Interface). Le terme IHM est consacré au contraire de celui-ci : « Computer Vision ». Que veut-il dire ? Il désigne quoi exactement ? Le traitement d'image ? l'analyse d'image ? filmer une scène avec du matériel numérique ?
« Cam-Trax, c'est essentiellement Yaron Tanne, qui aurait développé pratiquement seul le logiciel dans son appartement de Tel Aviv, selon TechCrunh. »
Qu'est-ce qu'il est fort ! Il sait lire des papiers scientifiques ! Vous remarquerez que les objets traqués ont des formes géométriques et des couleurs simples… La vidéo est sympa parce qu'elle montre des applications ludiques. Un détail : la profondeur n'est pas prise en compte par le système.
Concernant la motion capture : les tâches sont des réflecteurs qu'on appelle « cibles ». En éclairant par lumière infrarouge et en filmant de ces cibles la lumière reflétée grâce à des caméras bien placées, on réussit à situer dans l'espace ces cibles. En connaissant leur position on peut les relier pour former un squelette à habiller (par un humanoïde par exemple). Pour que ce système fonctionne correctement, il faut disposer judicieusement plusieurs caméras pour faire en sorte de ne pas « perdre de vue » certains cibles lors des mouvements de la personne, sinon on obtient de grossières approximations.
Comment la société Image Metrics réussit à éviter les cas d'occultations ? Comment fait-elle pour relier rapidement entre eux des points présents dans un nuage de points ? Les modèles 3D obtenus ne sont pas bruité ? pas boursouflés ?
à elLolo
De rilax13
15H40 | 19/06/2008 |
IHM peut vouloir dire les deux en français ; -)
btw : GUI ou HMI en anglais (mon babylone donne : HMI
Human Machine Interface or Interaction / Interface Homme/machine (F) )
sinon je suis d'accord avec toi pour le système, c'est gadget.
à elLolo
De trankzen
Je ne suis pas un anxyolitique | 15H45 | 19/06/2008 |
Captain Nitpicker to the rescue !
GUI n'est pas a une traduction valide de IHM dans le sens ou une IHM n'est pas nécessairement graphique. Une interface en ligne de commande (Command Line Interface ou CLI en anglais) est une IHM mais n'est pas considérée comme une interface graphique. De même, un serveur Audiotel propose une IHM qui n'a rien de graphique.
à elLolo
De PetitPiteux
16H48 | 19/06/2008 |
« computer vision » est tout a fait consacré (vision par ordinateur en français), une communauté entre l'ia, le traitement du signal/des images et les math appli. Elle se différencie du traitement d'image par le fait qu'elle cherche a *comprendre* une image, extraire de l'info, et non juste la traiter ; passer a un autre niveau sémantique et pas juste la transformer.
Ensuite les problèmes traitées sont extrêmement complexe et, dans leur généralité, pas résolu. Les solutions sont valides dans un cadre restreint, mais il existe toujours des contre exemple si on en sort.
Mais sur des appli ciblés dans un cadre pas trop contraignant comme le jeux video, on commence a avoir des choses qui marche pas mal… Donc les occultations, si on se place dans un cadre ou elle n'arrive pas/ou elle n'ont pas d'importance, on s'en fou. Suffit de prévenir le joueur que sa grand mère ne doit pas passer devant lui quand il joue…
(je ne dit pas que ces appli ne sont pas des gadjet d'un certain point de vue, juste que personne ne prétend vraiment qu'il s'agisse d'autre chose ; on parle d'appli grand publique, pas de journaux scientifique. Quand ce genre de truc se retrouve en conf, c'est plus génant…)
De magic.marmelade
16H38 | 19/06/2008 |
je pense que cette avancee est un simple petit pas. Quand je regarde la tronche de mon ordinateur, grosse boite obese, je sais pas combien de connections et de cables a brancher, des metres de fils sous le bureau…. pour avoir tout ce dont j'ai besoin… son, images, camera… Deux ecrans…bref, tout cela est de la prehistoire… indeniablement ce qu'on appelle aujourd'hui micro ordinateur, PC va evoluer vers quelque chose de portable pour de vrai, reconnaissant la voix, les mouvements… comme dit Stark le designer… le design, les objets autour de nous qui nous facilitent la vue, les interrupteurs, les machines, les ordinateurs… tout cela aura disparu un jour au profit de capteurs intelligents…
imaginez une boite grosse comme un portable aujourd'hui qui soit un ordinateur, un projecteur video, capable de reconnaitre vos mouvements et votre voix…
je crois que dans quelques annees ce sera le cas.
et bien sur, les meilleurs progrets seront utilises en exclusivite pour nous sapper de la liberte, fini les 10 millions de camera dans le monde pour filmer tout vos faits et gestes, meme plus besoin, on sait en permanence ou vous etes, ce que vous dites, ce que vous faites !
ah quel bonheur !
De supprimé à la demande du riverain 23 mars
x | 10H31 | 20/06/2008 |
Bonjour,
Ce qui m'intéresse dans toutes ces nouveautés, c'est l'usage qui pourrait être fait pour mes amis handicapés, notamment mal ou non voyants (à rapprocher de la reconnaissance vocale qu'ils utilisent quotidiennement).
A votre avis/connaissance, ces évolutions peuvent-elles améliorer l'accessibilité et/ou leur autonomie (là j'anticipe et je m'adresse aux pros ! )
à supprimé à la demande du riverain 23 mars
De Pierre Vandeginste
(auteur)
Journaliste scientifique, blog Aïe ... | 11H40 | 20/06/2008 |
C'est évident !
Si un logiciel peut « voir » certaines choses, on peut imaginer des applications venant en aide aux mal-voyants. Un exemple connu est la lecture optique. La traduction en braille de texte en noir est une application d'une forme de vision artificielle.
à Pierre Vandeginste
De rilax13
14H45 | 20/06/2008 |
c'est pas évident au vu de ce système car le feedback est visuel..
ensuite le braille c'est pas la panacée pour les personnes mal voyantes, un très faible % de la population mal voyante le maitrise (c'est 10% de la pop il me semble), ou est incapable de lire le braille à cause d'une sensibilité tactile trop faible. ->Le braille n'est pas un gage d'accessibilité contrairement à ce qui est pensé..
à rilax13
De Pierre Vandeginste
(auteur)
Journaliste scientifique, blog Aïe ... | 12H35 | 21/06/2008 |
La traduction texte en noir - braille n'est qu'un exemple.
On sait aussi passer de la lecture à l'énoncé vocal…
De supprimé à la demande du riverain 23 mars
x | 13H26 | 20/06/2008 |
Si c'était si évident que ça, je n'aurai pas posé ma question ! !
Merci toutefois d'avoir pris un peu de temps pour me répondre.
à supprimé à la demande du riverain 23 mars
De rilax13
14H50 | 20/06/2008 |
effectivement.. l'avenir pour les personnes mal voyantes selon moi, c'est le brain port, développé aux usa. c'est un système qui transforme les images issues d'une caméra en impulsions électriques discrétisées sur une matrice placée sur la langue. Bon c'est un peu un jargon affreux que j'utilise, mais je vous encourage à vous documenter dessus. (je précise que c'est non invasif, permet « réellement » de voir le monde réel(mais qu'est ce que le réel pour le cerveau : P) , est hélas développé sur des fonds militaires, mais fonctionne : ]
De Pierre Vandeginste (auteur)
Journaliste scientifique, blog Aïe ... | 12H43 | 21/06/2008 |
Le BrainPort est sans aucun doute un truc assez génial.
Par ailleurs, une douzaine d'équipes dans le monde bossent sur des rétines électroniques. Actuellement une personne en France, opérée par le Pr Sahel, teste celle de Second Sight (Californie).
Mais surtout, il y a aujourd'hui quelque chose comme 5 approches de la lutte contre certaines cécités, qui semblent prometteuses. Il se pourrait bien que l'œil bionique se fasse doubler dans la dernière ligne droite par une thérapie cellulaire, génétique ou autre.
à Pierre Vandeginste
De rilax13
16H36 | 23/06/2008 |
vi : ) le bionique me pose des problèmes éthiques personnellement, mais c'est un autre sujet ^^
le brainport pour continuer sur lui, permet de guérir des problèmes sensorimoteurs aussi, de façon spectaculaire ! on ne sait pas du tout comment, ni pourquoi ça marche, mais les résultats sont là : ]
et je suis d'accord, pour la translation écrit vocal, pour l'instant on ne fait pas mieux. reste à trouver un médium discret pour que cela soit orienté vers la personne qui en a besoin sans la pointé du doigt quand elle utilise cet outil en publique : )
à Pierre Vandeginste
De CourageuxAnonyme
le vrai | 22H16 | 23/06/2008 |
Juste pour info, l'implant cochléaire permet de réhabiliter l'audition dans certains cas de surdité. Il s'agit d'une oreille « bionique », implantée dans l'oreille interne du patient. Plus de 100 000 personnes sont implantées chaque année dans le monde entier. L'implant permet, dans certains cas, de permettre à des enfants souffrant d'une surdité congénitale de pouvoir apprendre à parler.
Probablement un des rares domaines où la recherche en audition à un peu d'avance sur la vision. Probablement parce que l'audition est tellement plus indispensable socialement que la vision.
(Je peux écrire ça, c'est politiquement correcte ? Ça va tant que je ne dis pas que c'est pas grave parce que les aveugles ne me liront pas ? Non là ça devient douteux et de mauvais goût… mais j'ai toujours du mal à résister à une ironie quand elle se présente… un vilain défaut…)