Selbst - Anhui Electric Bike Group Co., Ltd

Wissenschaftliche Berichte Band 13, Artikelnummer: 8966 (2023) Diesen Artikel zitieren

2 Altmetrisch

Details zu den Metriken

Ein selbstorganisiertes Phänomen in der Haltungskoordination ist für das Verständnis des automatischen Umschaltmechanismus von gleichphasigen und gegenphasigen Haltungskoordinationsmodi beim Stehen und verwandten suprahaltungsbezogenen Aktivitäten von wesentlicher Bedeutung. Zuvor wurde ein modellbasierter Ansatz vorgeschlagen, um ein solches selbstorganisiertes Phänomen zu reproduzieren. Wenn wir dieses Problem jedoch einschließlich des Prozesses zur Etablierung des internen Vorhersagemodells in unserem Zentralnervensystem angehen, ist der Lernprozess von entscheidender Bedeutung, um bei der Etablierung eines neuronalen Netzwerks zur Verwaltung der adaptiven Haltungskontrolle berücksichtigt zu werden. Insbesondere wenn sich Körpermerkmale aufgrund von Wachstum oder Alterung verändern können oder bei Säuglingen zunächst unbekannt sind, kann eine Lernfähigkeit die Hyperadaptivität der menschlichen motorischen Kontrolle verbessern, um die Haltungsstabilität aufrechtzuerhalten und Energie im täglichen Leben zu sparen. In dieser Studie wurde versucht, ein selbstorganisierendes neuronales Netzwerk zu generieren, das den Haltungsmodus adaptiv koordinieren kann, ohne ein vorheriges Körpermodell hinsichtlich Körperdynamik und -kinematik anzunehmen. Haltungskoordinationsmodi werden in Kopf-Ziel-Tracking-Aufgaben durch einen Deep-Reinforcement-Learning-Algorithmus reproduziert. Die Übergänge zwischen den Haltungskoordinationstypen, dh In-Phase- und Anti-Phase-Koordinationsmodi, könnten durch Ändern der Aufgabenbedingung des Kopfverfolgungsziels und durch Ändern der Frequenzen des sich bewegenden Ziels reproduziert werden. Diese Modi gelten als neu auftretende Phänomene, die bei Aufgaben zur Verfolgung des menschlichen Kopfes auftreten. Verschiedene Bewertungsindizes wie Korrelation und relative Phase von Hüft- und Sprunggelenk werden analysiert, um die Leistung des selbstorganisierenden neuronalen Netzwerks zu überprüfen und den Haltungskoordinationsübergang zwischen dem In-Phase- und Anti-Phase-Modus zu erzeugen. Darüber hinaus kann sich das neuronale Netzwerk nach dem Lernen auch an kontinuierliche Änderungen der Aufgabenbedingungen und sogar an ungelernte Körpermassebedingungen anpassen und dabei einen konsistenten In-Phase- und Anti-Phase-Moduswechsel gewährleisten.

Das Verständnis der menschlichen Haltungskoordination ist wichtig, um Rehabilitationsübungen zu entwickeln, die die Lebensqualität älterer Menschen und Menschen mit motorischen Beeinträchtigungen oder Hirnstörungen wie Schlaganfall verbessern. Die Erforschung adaptiver und synergetischer Haltungskontrollmechanismen ist wichtig, um die Wiederherstellung des Gleichgewichts durch eine effektive Gestaltung des körperlichen Trainings zu fördern.

Es wurden umfangreiche Studien zur menschlichen Gleichgewichtskontrolle durchgeführt, um die motorischen Lernfähigkeiten des Menschen bei täglichen Stehaufgaben zu verstehen1,2. Grundlegende menschliche Gleichgewichtskontrollstrategien wie Knöchelstrategie und Hüftstrategie wurden durch Menschenexperimente3,4,5 und Computermodellsimulationen6,7,8,9,10 gut untersucht. Diese Strategien, einschließlich der kinematischen und kinetischen Einschränkungen der Körpermotorik, würden uns helfen, den bestehenden Funktionsmoduswechsel der Haltungskoordination bei der Gleichgewichtskontrolle unter verschiedenen äußeren Störungen oder bei damit verbundenen suprahaltungsbezogenen Aktivitäten zu verstehen.

Zur Beurteilung von Koordinationsmustern wurden Haltungskontrollmuster über Hüft- und Sprunggelenke3 und die relativen Phasen, wie z. B. In-Phase und Anti-Phase, definiert. Ihre Stärken und Grenzen wurden in einer Studie11 zur Haltungskoordination zwischen Hüfte und Sprunggelenk bei verschiedenen Greifaufgaben diskutiert. Als Bewegungskoordinationseinheiten12 sind Bewegungen zwischen Hüft- und Sprunggelenk für die Haltungskontrolle im Stand notwendig13. Die Koordination von Knöchel und Hüfte während der Strategie des ruhigen Stehens14 für zwei Bedingungen: Augen offen und geschlossen, wurde mit den entsprechenden Phasenporträts der Winkelverschiebung, Geschwindigkeit und Beschleunigung von Hüfte und Knöchel beobachtet. Die Beiträge der Knöchel- und Hüftgelenke wurden für die Multisegmentkontrolle in menschlichen Experimenten an gesunden und Parkinson-Teilnehmern sowie in Computermodellsimulationen ausgezeichnet15. In ähnlicher Weise wurde die intersegmentale Bewegungskoordination zwischen Hüft- und Knöchelgelenken, die durch die Schwankungsfrequenzen im Hinblick auf Gleichgewichtskontrollstrategien wie Knöchel- und Hüft-Knöchel-Strategie beeinflusst wird, genutzt, um die sensorischen und motorischen Beeinträchtigungen bei unvollständiger Rückenmarksverletzung (iSCI) zu bewerten. 16. In Bezug auf das selbstorganisierende Phänomen der Haltungskoordination ist aus Arbeiten der Bardy-Gruppe bekannt, dass der selbstorganisierende Modus auf natürliche Weise mit zwei Modi, „gleichphasig oder gegenphasig“, von Hüft- und Knöchelgelenken in den menschlichen Kopfverfolgungsexperimenten entsteht17 ,18,19. Abhängig von der Zielfrequenz bei der gestellten Aufgabe wurde für niedrige Frequenzen der Inphase-Modus und für hohe Frequenzen der Antiphase-Modus verwendet.

Es ist erwähnenswert, dass Optimierungsalgorithmen zur Implementierung einer menschenähnlichen Haltungsbewegungsreproduktion angewendet werden können. Beispielsweise wurde der Übergang zwischen In-Phase- und Anti-Phase-Haltungskoordinationsmodi durch das dynamische Optimierungsmodell in früheren Studien vorhergesagt20,21 und der Einfluss von Einschränkungen auf die Auswahl von Haltungsstrategien wurde bewertet, um die Fähigkeit der Haltungskontrolle zu verstehen . Es wurde ein eingeschränkter Optimierungsprozess vorgeschlagen, der auf der Minimierung eines energetischen Kriteriums mit einer Gleichgewichtsbeschränkung basiert21, aber dieses Modell berücksichtigte nur stationäres Verhalten. Das transiente dynamische Verhalten konnte mit Jacobi-Pseudoinversen reproduziert20 werden, um eine Minimalnormlösung bereitzustellen. Die oben genannten Modelle erfordern jedoch Kenntnisse über Körperkinematik oder -dynamik für den Modelloptimierungsansatz.

Nach unserem besten Wissen gibt es jedoch keine Literatur über einen modellfreien Ansatz, der die Reproduktion selbstorganisierter Haltungskoordinationsmodi für Head-Tracking-Aufgaben reproduzieren kann. Insbesondere wenn sich Körpermerkmale aufgrund von Wachstum oder Alterung verändern können oder bei Säuglingen zunächst unbekannt sind, kann eine Lernfähigkeit für die Hyperadaptivität der menschlichen Haltungskontrolle von entscheidender Bedeutung sein. Daher schlagen wir in dieser Studie vor und überprüfen, ob wir ein selbstorganisierendes neuronales Netzwerk reproduzieren können, das mit einem modellfreien Lernalgorithmus für den menschenähnlichen Phasenübergang „Hüfte-Knöchel“ trainiert wurde, abhängig von den Aufgabenbedingungen.

Daher entwickeln wir eine lernbasierte Methode, um neue Mechanismen der Haltungskoordinationsmodi in verschiedenen Situationen zu untersuchen. Die Hauptbeiträge unserer Studie sind wie folgt zusammengefasst.

Es wurde eine Deep Reinforcement Learning (DRL)-Anwendung vorgeschlagen, um neuronale Netze zu bilden, die selbstorganisierende Haltungskoordinationsmodi während Head-Tracking-Aufgaben reproduzieren.

Die aufgabenbezogenen Einschränkungen und Frequenzen des Zielpunkts wurden berücksichtigt und ihr Einfluss auf den Wechsel der Haltungskoordinationsmodi untersucht.

Verschiedene Bewertungsindizes, wie Korrelation und relative Phase von Knöchel und Hüfte, wurden verwendet, um die Haltungsphasen während Head-Tracking-Aufgaben zu unterscheiden, und das Übergangsverhalten zwischen In-Phase und Anti-Phase wurde mit dem erlernten neuronalen Netzwerk von a reproduziert kontinuierlicher Wechsel des Aufgabenzustandes.

Das erlernte neuronale Netzwerk zeigte auch einen In-Phase- und Anti-Phase-Wechsel für nicht erlernte unterschiedliche Bedingungen der Oberkörpermasse für übertragbare Fähigkeiten. Für die Bedingungen mit höherer Obermasse wurde eine Gegenphase eingesetzt, um den erhöhten Trägheitseffekt zu bewältigen und gleichzeitig das Gleichgewicht aufrechtzuerhalten.

Wir haben uns in dieser Studie für die Verwendung von Deep Reinforcement Learning entschieden, da es sich um einen geeigneten Algorithmus zur Untersuchung von Kontrolllösungen unter Redundanz und unter der Bedingung einer unzugänglichen Körperdynamik für die Optimierung mit mehreren Zielen handelt22.

Der nächste Teil des Papiers ist wie folgt aufgebaut. Der Abschnitt „Modell und Methodik“ stellt das Modell und die Methodik vor, einschließlich Simulationseinstellung, Algorithmus, Ziel- und Belohnungsfunktion und Experimentdesign. Die Ergebnisse des adaptiven motorischen Lernens mit verschiedenen experimentellen Einstellungen werden im Abschnitt „Ergebnisse des motorischen Lernens bei Haltungsaufgaben“ analysiert. Im Abschnitt „Weitere Diskussion“ wird die Beziehung zwischen Einflussfaktoren und Phasenkoordination weiter diskutiert. Die Schlussfolgerungen und Perspektiven dieser Studie sind im Abschnitt „Schlussfolgerung und Perspektive“ zusammengefasst.

(a) Simulationsmodell eines Humanoiden im Isaac Gym. (b) Das Trainingsgerüst von PPO, das eine Art von Deep Reinforcement Learning mit Akteur-Kritiker-Struktur darstellt.

Das Training neuronaler Netze mithilfe von Deep Reinforcement Learning erfordert das Sammeln von Daten, die während der Interaktion des humanoiden Agenten mit der externen physischen Umgebung unter der Schwerkraft generiert werden. Wir haben unsere Experimente in der Simulationsumgebung mit der Physik-Engine von Isaac Gym23 durchgeführt.

Isaac Gym ist eine leistungsstarke GPU-basierte Physiksimulations-Engine, die von der Firma NVIDIA23 für das Roboterlernen entwickelt wurde. Mit durchgängiger GPU-Beschleunigung und paralleler Verarbeitung Tausender Simulationsumgebungen kann Isaac Gym die Trainingsgeschwindigkeit bei der Durchführung von Reinforcement-Learning-Aufgaben im Vergleich zu anderen Simulationssoftwareumgebungen erheblich steigern.

Das Simulationsmodell, das wir für das Experiment verwendet haben, basiert auf dem humanoiden Agenten in Isaac Gym, wie in Abb. 1 dargestellt. Die Originalversion des humanoiden Roboters verfügt über 21 Freiheitsgrade. Um irrelevante Variablen auszuschließen, haben wir in unseren Simulationen nur die Hüft- und Knöchelgelenke auf beiden Körperseiten beibehalten und die anderen Gelenke fixiert. Der Abstand zwischen zwei Fuß war die Schulterbreite. Indem wir den gespiegelten Input an dieselben Gelenke weitergeben, reduzieren wir den Bewegungsbereich des Humanoiden auf einen 2D-Raum. Dann hat der Roboter vier Freiheitsgrade: Hüfte und Knöchel für das rechte und linke Bein. Die weiteren physikalischen Parameter des Simulationsmodells sind in Tabelle 1 dargestellt.

Wir verwenden Proximal Policy Optimization (PPO)22, um den Roboter in unserem Experiment zu trainieren. Dabei handelt es sich um einen der modernsten Deep-Reinforcement-Learning-Algorithmen, der auf dem Actor-Critic-Framework basiert. PPO kann auf Basis einer parallelen Architektur mit synchronen Aktualisierungen gleichzeitig Trainingsdaten von mehreren Agenten sammeln. Dadurch kann die parallele Isaac-Gym-Simulation auf der GPU voll ausgenutzt werden, um den Trainingsprozess präziser zu gestalten.

Wie in Abb. 1b gezeigt, gibt es im Trainingsrahmen von PPO zwei neuronale Netze, eines ist das Akteurnetzwerk \(\pi _{\theta }\left( a_{t} \mid s_{t}\right) \) und das andere ist das Kritikernetzwerk \(V_{\phi }\left( s_{t}\right)\). Das Akteurnetzwerk \(\pi _{\theta }\) wird verwendet, um die Aktion \(a_t\) entsprechend dem Eingabezustand \(s_t\) in jedem Steuerungszeitschritt abzutasten. Das kritische Netzwerk \(V_{\phi }\left( s_{t}\right)\) ist die Wertfunktion, die die erwartete durchschnittliche Rendite ausgehend vom Zustand \(s_t\) schätzen kann.

PPO aktualisiert das Akteursnetzwerk und das Kritikernetzwerk basierend auf den Erfahrungen, die aus der Interaktion zwischen dem Agenten und der Umgebung gesammelt wurden. Die zur Aktualisierung des Akteurnetzwerks \(\pi _{\theta }\) verwendete Verlustfunktion wird wie folgt ausgedrückt:

wobei \(\hat{A}_{t}\) der geschätzte Vorteil zum Zeitpunkt t ist. Der Vorteil \(A_t\) wird verwendet, um zu bewerten, wie gut oder schlecht die Aktion \(a_t\) im Zustand \(s_t\) ist. \(A_t\) größer als Null zeigt an, dass die aktuell durchgeführte Aktion mehr Belohnung als erwartet erhalten kann und umgekehrt.

PPO verwendet eine Methode namens „Clipping“, um das Ausmaß der Aktualisierungen zu begrenzen und so die Stabilität des Trainings zu verbessern. Das Likelihood-Verhältnis \(\omega _t\) wird verwendet, um den Unterschied zwischen der neuen Richtlinie \(\pi _{\theta }\) und der alten Richtlinie \(\pi _{\theta _{\text{ old }} zu messen. }}\).

Wenn \(\omega _t\) außerhalb des Bereichs von \(\left( 1-\varepsilon , 1+\varepsilon \right)\ liegt, ist die Clip-Funktion \({\text {clip}}\left( \omega _ {t}(\theta ), 1-\varepsilon , 1+\varepsilon \right)\) setzt den Gradienten auf Null. Dann wählt die Minimalfunktion eine Untergrenze für \(L^{CLIP}(\theta)\) zwischen den abgeschnittenen und nicht abgeschnittenen Vorteilen.

Die Verlustfunktion für das kritische Netzwerk wird wie folgt bezeichnet:

wobei \(V_{\theta }\) der geschätzte Wert und \(V_{t}^{{\text {Ziel}}}\) der tatsächliche Wert ist. Die in unseren Experimenten verwendeten Hyperparameter von PPO sind in Tabelle 2 aufgeführt.

Unser Ziel ist es, den Kopf des Humanoiden einer periodischen Hin- und Herbewegung in der X-Achsenrichtung in der Sagittalebene folgen zu lassen. Wir verwenden den roten Ball über dem Kopf des Humanoiden, um die Position des Zielpunkts zur besseren Visualisierung anzuzeigen. Die Bewegungsgleichung der Flugbahn für das Head-Tracking-Ziel lautet wie folgt:

Dabei ist A die Amplitude, sodass sich der Zielpunkt entlang der X-Achse im Bereich [0, 2A] bewegt. f bezeichnet die Bewegungsfrequenz des Zielpunktes. Diese Zieleinstellung ist identisch mit dem in der Studie verwendeten Experiment zur Verfolgung des menschlichen Kopfes19, da für die stehenden Teilnehmer eine anteroposteriore gerichtete Zielverfolgung mit dem Kopf durchgeführt wurde.

Die Belohnungsfunktion \(R_{total}\) wird wie folgt ausgedrückt:

wobei \(R_{stay}\) verwendet wird, um die Bewegung des Fußes des Humanoiden relativ zum Boden zu begrenzen, wobei \(P_{f0}\) die Ausgangsposition des Fußes des Humanoiden ist und \(P_{ft}\) ist die Position des humanoiden Fußes zum Zeitpunkt t. \(R_{Ziel}\) wird verwendet, um den Humanoiden zu ermutigen, das Ziel zu verfolgen, wobei \(P_{Ziel_x}\) die Position des Zielpunkts auf der x-Achse und \(P_{Kopf_x}\) ist die Position des humanoiden Kopfes auf der x-Achse. \(R_{Energie}\) und \(R_{Drehmoment}\) werden verwendet, um den Energieverbrauch des Roboters zu begrenzen, wobei \(\tau _j\) das Drehmoment des Gelenks j ist, \(\omega _j\) ist die Winkelgeschwindigkeit des Gelenks j und \(\Delta t\) ist das Zeitintervall zwischen der Abtastung von Simulationsdaten. Wenn die Höhe des Schwerpunkts des Rumpfes des Humanoiden weniger als 1 m beträgt, wird davon ausgegangen, dass der Humanoide gefallen ist, und \(R_{total}\) wird auf -1 gesetzt. Die Gewichte für die Anpassung jedes Belohnungsbegriffs sind \(\alpha\), \(\beta\) und \(\gamma\).

Es gibt viele Faktoren, die die Haltungs- und Bewegungskoordination des Humanoiden beeinflussen können. In unseren Experimenten analysierten wir die Auswirkungen der Bewegungsfrequenz des Zielpunkts, des Energieverbrauchsgewichts auf die Belohnung des Lernprozesses und änderten nach dem Erlernen den Zustand der ungelernten Oberkörpermasse, um auch eine neue Aufgabe zu prüfen.

Der Energieverbrauch wird durch Anpassen der Variablen \(\gamma\) in Gleichung angepasst. (6). Die Frequenz des Zielpunkts wird durch die Variablen f in Gl. eingestellt. (5).

In diesem Abschnitt wird der Einfluss aufgabenbasierter Einschränkungen auf die Selbstorganisation von Haltungsmodi zwischen In-Phase und Anti-Phase bei Tracking-Balance-Aufgaben untersucht. Die Auswirkungen der Energieverbrauchsstrafe auf Head-Tracking-Aufgaben wurden ebenfalls untersucht. Der Energieverbrauch wurde in Menschenversuchen24 und Simulationen7,20,21,25 als wesentlicher Faktor für aufrechte Stehaufgaben nachgewiesen. Dies ist sinnvoll, da unser menschlicher Körper bei der Ausführung bestimmter Bewegungsaufgaben im Alltag versucht, durch eine energieoptimale Politik Energie einzusparen.

Diese Aufgabenbeschränkungen werden in Tracking-Balancing-Simulationen berücksichtigt, die durch eine modellfreie Lernmethode implementiert werden, und ihr Einflussmechanismus wird in dieser Studie untersucht. Die aufgabenbasierten Einschränkungen und die Häufigkeit der Kopfverfolgung des Zielpunkts wurden in menschlichen Experimenten17,19,26 und in der Simulation des Modells des doppelten invertierten Pendels mit Feedback20 auf ihren Einfluss auf die Hüft- und Knöchelkoordination untersucht. Ihre Arbeit untersuchte jedoch nicht die lernbasierte Adaptivität der motorischen Koordination. Daher ist es wichtig zu überprüfen, ob modellfreie Lernmethoden ein neuronales Netzwerk aufbauen können, um adaptives selbstorganisierendes Verhalten zu erzeugen, um die Wirksamkeit von In-Phase- und Anti-Phase-Koordinationsmodi zwischen Hüft- und Knöchelgelenken weiter zu untersuchen.

Obwohl die Kopfverfolgungsaufgabe keine alltägliche Aktivität im täglichen Leben ist, ist sie gleichbedeutend mit der Aufrechterhaltung der Kopfstabilität, wenn der Boden beschleunigt oder verlangsamt. Bei kleinen Störungen reicht ein Gleichphasensymmetrierung aus, bei größeren Störungen ist ein Gegenphasensymmetrierung erforderlich. Diese Situation tritt häufig auf, wenn wir im täglichen Leben Bus oder Bahn fahren. Durch Anpassen der Kopfgeschwindigkeit können wir die Störintensität verändern.

Screenshots von Lernaufgaben zur Verfolgung und zum Ausgleich bei der Bewegungsverfolgungsfrequenz f des Zielpunkts in Gl. (5) im Hinblick auf 0,15 [Hz] und 1,5 [Hz]. Wobei der Energieverbrauchs-Strafparameter \(\gamma\) in Gl. (6) beträgt 20. Die Bewegungsamplitude A des Zielpunkts in Gl. (5) beträgt 0,1 [m]. Die Knöchel- und Hüftsteifheit beträgt weiterhin 25 [Nm/rad] bzw. 125 [Nm/rad].

Position des Verfolgungsziels und des Kopfes des humanoiden Agenten und seine Entfernung bei der Bewegungsverfolgungsfrequenz f in Gl. (5) im Hinblick auf 0,15 [Hz] und 1,5 [Hz]. Wobei der Energieverbrauchs-Strafparameter γ in Gl. (6) beträgt 20. Die Bewegungsamplitude A des Zielpunkts in Gl. (5) beträgt 0,1[m]. Die Knöchel- und Hüftsteifheit beträgt weiterhin 25 [Nm/rad] bzw. 125 [Nm/rad].

Gelenkwinkel von Knöchel und Hüfte bei der Bewegungsverfolgungsfrequenz f in Gl. (5) im Hinblick auf 0,15 [Hz] und 1,5 [Hz]. Wobei der Energieverbrauchs-Strafparameter \(\gamma\) in Gl. (6) beträgt 20. Die Bewegungsamplitude A des Zielpunkts in Gl. (5) beträgt 0,1 [m]. Die Knöchel- und Hüftsteifheit beträgt weiterhin 25 [Nm/rad] bzw. 125 [Nm/rad]. \(t_0\) und \(t_1\) sind die Zeitschritte, die den maximalen Winkeln von Knöchel und Hüfte im aktuellen Bewegungszyklus entsprechen.

In diesem Abschnitt wird gezeigt, wie sich die Tracking-Frequenz auf den selbstorganisierten Haltungskoordinationsmodus auswirkt. Die Änderung der Frequenz des verfolgenden Ziels kann die Bewegungsgeschwindigkeit des Kopfes bestimmen, mit der das humanoide Modell die Zielverfolgungsaufgaben abschließen kann. Darüber hinaus kann die Änderung der Bewegungsgeschwindigkeit die Gelenkkoordinationsmodi beeinflussen und so die Stabilität der Gleichgewichtsleistung gewährleisten. Somit können die In-Phase- und Anti-Phase-Muster hinsichtlich der Tracking-Frequenz rekrutiert werden. Die zehn verschiedenen Tracking-Frequenzen sind auf folgende Werte eingestellt: 0,15, 0,30, 0,45, 0,60, 0,75, 0,90, 1,05, 1,20, 1,35 und 1,50 [Hz]. Screenshots von Lernaufgaben zur Verfolgung und zum Ausgleich bei der Bewegungsverfolgungsfrequenz f des Zielpunkts in Gl. (5) in Bezug auf 0,15 [Hz] und 1,5 [Hz] sind in Abb. 2 dargestellt. Für den Fall, dass der Energieverbrauchsbenachteiligungsparameter \(\gamma\) in Gl. (6) beträgt 20. Die Bewegungsamplitude A des Zielpunkts in Gl. (5) beträgt 0,1[m]. Die Knöchel- und Hüftsteifheit beträgt weiterhin 25 [Nm/rad] bzw. 125 [Nm/rad]. Aus Abb. 2 geht hervor, dass die gleichphasigen motorischen Muster zwischen den Knöchel- und Hüftgelenken in der ersten Reihe für die Zielfrequenz 0,15 [Hz] beibehalten werden, während die gegenphasigen motorischen Muster zwischen den Knöchel- und Hüftgelenken in der zweiten Reihe erscheinen in der Zielphase \(60^{\circ }\), \(120^{\circ }\), \(180^{\circ }\), \(240^{\circ }\) und \(300 ^{\circ }\) für die Tracking-Zielfrequenz 1,5 [Hz]. Das entsprechende Beispiel für die Kopfbewegung ist in Abb. 3 dargestellt. Die Position des Verfolgungsziels und des Kopfes des humanoiden Agenten ist bei einer Bewegungsverfolgungsfrequenz von 0,15 [Hz] und 1,5 [Hz] dargestellt. Die entsprechenden Gelenkwinkel für Knöchel und Hüfte sind in Abb. 4 dargestellt, wo wir die Inphase für niedrige Frequenzen und die Antiphase für höhere Frequenzen bestätigen können.

Zunächst wird die entsprechende Verfolgungsgenauigkeit durch die Ziel-Kopf-Korrelation R, die mittlere Amplitude der Kopfbewegung und die mittlere Kopfgeschwindigkeit quantifiziert, wie in Tabelle 3 gezeigt. Die Ziel-Kopf-Korrelation R wird durch Personenkorrelationskoeffizienten berechnet. Anhand des hohen Werts der Korrelation R in Tabelle 3 können wir bestätigen, dass die Kopfverfolgungsaufgabe korrekt durchgeführt werden konnte. Bei der höheren Zielbewegungsfrequenz über 1,2 [Hz] beobachten wir seit dem hohen Wert einen leichten Rückgang der Ziel-Kopf-Korrelation R Die Tracking-Geschwindigkeit kann die Schwierigkeit beim Tracking von Aufgaben erhöhen.

Das Boxplot des Druckzentrums (CoP), beeinflusst durch verschiedene Bewegungsverfolgungsfrequenzen f des Zielpunkts in Gl. (5) 0,15, 0,30, 0,45, 0,60, 0,75, 0,90, 1,05, 1,20, 1,35 bzw. 1,50 [Hz]. Wobei der Energieverbrauchs-Strafparameter \(\gamma\) in Gl. (6) beträgt 20. Die Bewegungsamplitude A des Zielpunkts in Gl. (5) beträgt 0,1 [m]. Die Knöchel- und Hüftsteifheit beträgt weiterhin 25 [Nm/rad] bzw. 125 [Nm/rad].

Zweitens wird der Druckmittelpunkt (CoP) zur Schätzung der Gleichgewichtsstabilität verwendet. Das Boxplot des Druckzentrums (CoP), beeinflusst durch die folgenden Bewegungsverfolgungsfrequenzen f des Zielpunkts in Gl. (5) 0,15, 0,30, 0,45, 0,60, 0,75, 0,90, 1,05, 1,20, 1,35 und 1,50 [Hz] sind in Abb. 5 dargestellt. Die CoP-Verteilung nimmt mit zunehmender Trackingfrequenz zu. Bei einer Hochgeschwindigkeits-Tracking-Leistung sollte das Risiko bestehen, dass das Gleichgewicht verloren geht. Daher ist die Aufrechterhaltung des Gleichgewichts eine entscheidende Komponente bei Hochgeschwindigkeits-Tracking-Balancing-Aufgaben. In unserer Modellierung kann der humanoide Agent die Tracking-Balancing-Aufgaben für einen weiten Frequenzbereich erledigen und die Füße unterliegen einseitigen Einschränkungen. Dies zeigt die Robustheit unserer von PPO vorgeschlagenen trainierten Netzwerke.

Entwicklung des Korrelationskoeffizienten und der relativen Phase, beeinflusst durch unterschiedliche Bewegungsverfolgungsfrequenzen f des Zielpunkts in Gl. (5) 0,15, 0,30, 0,45, 0,60, 0,75, 0,90, 1,05, 1,20, 1,35 bzw. 1,50 [Hz]. Wobei der Energieverbrauchs-Strafparameter \(\gamma\) in Gl. (6) beträgt 20. Die Bewegungsamplitude A des Zielpunkts in Gl. (5) beträgt 0,1 [m]. Die Knöchel- und Hüftsteifheit beträgt weiterhin 25 [Nm/rad] bzw. 125 [Nm/rad].

Die Tracking-Frequenz ist ein Einflussfaktor für die Veränderung der motorischen Koordinationsmuster der Knöchel- und Hüftgelenke, z. B. In-Phase und Anti-Phase für Tracking-Balance-Aufgaben27. Daher haben wir versucht, die Selbstorganisation der Haltungskoordinationsmodi zu verstehen, die durch die Tracking-Frequenz in unseren Tracking-Balance-Aufgaben beeinflusst werden. Die Entwicklung des Korrelationskoeffizienten und der relativen Phase wird durch die folgenden Bewegungsverfolgungsfrequenzen f des Zielpunkts in Gleichung beeinflusst. (5) von 0,15 bis 1,50 [Hz] ist in Abb. 6 dargestellt. Wobei der Energieverbrauchsbenachteiligungsparameter \(\gamma\) in Gl. (6) beträgt 20. Die Bewegungsamplitude A des Zielpunkts in Gl. (5) beträgt 0,1[m]. Die Knöchel- und Hüftsteifheit beträgt weiterhin 25 [Nm/rad] bzw. 125 [Nm/rad]. Der Korrelationskoeffizient der Hüft- und Sprunggelenkwinkel kann die Eigenschaften der gesamten Koordinationsmuster zusammenfassen. Wie wir aus Abb. 6 erkennen können, bedeutet die entsprechende positive Korrelation für Trackingfrequenzen von 0,15, 0,30, 0,45 und 0,60 [Hz], dass die In-Phase-Muster zwischen den Knöchel- und Hüftgelenken funktionierten. Die negative Korrelation für die Trackingfrequenzen 0,75, 0,90, 1,05, 1,20, 1,35 und 1,50 [Hz] weist jedoch auf die gegenphasigen Muster zwischen Knöchel- und Hüftgelenken hin. Somit hängt der Übergang der Haltungskoordinationsmodi von der Änderung der Tracking-Frequenzen im Hinblick auf relativ niedrige und hohe Werte wie die obige Versuchseinstellung ab. Darüber hinaus korrelieren die Korrelationskoeffizienten für Hüfte und Knöchel negativ mit der relativen Phase.

Als nächstes diskutieren wir, wie sich die Änderung der Tracking-Frequenz auf die Knöchel- und Hüftgelenkwinkel auswirkt. In Abb. 6 korreliert die relative Phase positiv mit der Trackingfrequenz. Die relative Phase wurde als \(\left| t_0-t_1\right| \times f \times \pi\) berechnet, wobei f die Bewegungsfrequenz des Ziels ist, \(t_0\) und \(t_1\) die Zeitschritte sind entsprechend den maximalen Winkeln des Knöchels und der Hüfte im aktuellen Bewegungszyklus, wie in Abb. 4 dargestellt. Denn die hohe Tracking-Frequenz bedeutet eine schnelle Verfolgung von Bewegungsaufgaben. Diese schnelle Reaktion humanoider Agenten kann zu einer unsicheren Leistung führen, es sei denn, die Knöchel- und Hüftgelenke erhöhen die Bewegungsintensität in die entgegengesetzte Richtung, um die Beschleunigung/Verzögerung der oberen Gliedmaßen für das mögliche Sturzrisiko auszugleichen. Dann gibt es aufgrund der Anforderungen an die Aufrechterhaltung des Gleichgewichts keinen Lösungsraum mit phasengleicher gemeinsamer Nutzung. Es gibt jedoch eine Lösung, um die Projektion des gesamten Körperschwerpunkts auf den Boden nahe dem Fußbereich beizubehalten, wenn Knöchel und Hüfte gegenphasig koordiniert sind.

Die gemittelten Spitze-zu-Spitze-Gelenkpositionen für Hüfte und Knöchel sind in Abb. 7 dargestellt, um zu zeigen, wie sich der Hüftgelenkbereich von niedriger Frequenz zu hoher Frequenz verändert hat. Wir können die Zunahme der Hüftamplitude zusammen mit dem Anstieg des Hüftdrehmoments beobachten, während wir einen ähnlichen Bewegungsbereich für das Sprunggelenk haben. Dieser Trend steht im Einklang mit der bisherigen menschlichen Messung19 und auch mit früheren modellbasierten Simulationsergebnissen20. Es ist gut zu bestätigen, dass derselbe selbstorganisierende Prozess mit dem erlernten neuronalen Netzwerk ohne vorherige Nutzung von Dynamik- und Kinematikinformationen reproduziert werden konnte. Da der Bewegungsbereich unter Berücksichtigung der Winkelpositionen der Hüftgelenke für Hochfrequenz-Tracking viel größer ist als der von Knöchelgelenken, können wir verstehen, dass Hüftgelenke die aktive und führende Koordination für Hochgeschwindigkeits-Tracking-Bewegungen übernehmen. Es ist erwähnenswert, dass die Trackingfrequenz bei der jeweiligen Aufgabe bestimmen kann, wie die Koordinationsmodi der Knöchel- und Hüftgelenke eingesetzt werden.

Die Untersuchung der Gleichgewichtskontrolle mit verschiedenen Kopfverfolgungsfrequenzen und ihre Analyse mit verschiedenen motorischen Koordinationsmodi hat erhebliche Auswirkungen auf klinische Anwendungen. Das Verständnis, wie sich die Frequenz der Kopfbewegung auf die motorischen Koordinationsmodi auswirkt, kann die Entwicklung wirksamer Rehabilitationsprogramme für Personen mit Gleichgewichtsstörungen, beispielsweise solchen mit neurologischen Erkrankungen, unterstützen. Durch die Entwicklung von Rehabilitationsprogrammen, die auf bestimmte motorische Koordinationsmodi abzielen, können wir die Haltungskontrolle verbessern und das Sturzrisiko verringern. Darüber hinaus kann die Untersuchung motorischer Koordinationsmodi dabei helfen, Personen zu identifizieren, bei denen aufgrund veränderter Koordinationsmuster möglicherweise ein höheres Sturzrisiko besteht. Durch die Untersuchung motorischer Koordinationsmodi und ihrer Beziehung zur Geschwindigkeit der Kopfbewegung können Ärzte gezielte Interventionen entwickeln, um die Haltungskontrolle zu verbessern und das Sturzrisiko bei Hochrisikogruppen wie älteren Erwachsenen oder Personen mit neurologischen Erkrankungen zu verringern.

(a) Peak-to-Peak-Verbindungspositionen. Jeder Punkt ist der Mittelwert der Simulationsergebnisse in 100 s. (b) Drehmomentamplituden von Knöchel und Hüfte. Das Hüftdrehmoment ist bei Inphase kleiner und bei Antiphase größer.

Nachdem wir die Haltungsmodusübergänge aufgrund von Aufgabenbeschränkungen untersucht haben, konzentrieren wir uns nun auf einen anderen Faktor, nämlich die Energiebenachteiligung bei der Belohnung. Der Energieverbrauch kann bestimmen, welche Art von Bewegungsrichtlinie zur Umsetzung von Bewegungsaufgaben angewendet werden soll. Daher gehen wir davon aus, dass der Energieverbrauch die Haltungskoordination zwischen Sprunggelenk und Hüftgelenk verändern könnte. Aus Gl. (6) \(R_{Energie}\) und \(R_{Drehmoment}\) werden verwendet, um den Energieverbrauch des Roboters zu begrenzen. Um in dieser Arbeit den Einfluss der Energiebenachteiligung auf die Haltungskoordination bei Tracking-Balancing-Aufgaben zu verstehen, optimieren wir das Energiegewicht (Energieindex) \(\gamma\) in Gl. (6) mit den folgenden Werten: 0, 5, 10, 15, 20, 25, 30, 35 und 40. Anschließend werden die Leistung von Tracking-Balance-Aufgaben und der Übergang der Haltungskoordination getrennt untersucht.

Gemäß den Ergebnissen von Tabelle 4 konnte die Ziel-Kopf-Korrelation R für jeden Energieindex hoch gehalten werden. Diese Korrelationen zeigen, dass die Aufgaben für Kopfverfolgungsaufgaben auch bei unterschiedlichen Einstellungen der Energieeinbuße ordnungsgemäß ausgeführt wurden. Die entsprechende Kopfamplitude zeigt unabhängig von der Energieeinbuße auch eine ähnliche Kopfbewegungstendenz. Daher können wir davon ausgehen, dass Energieeinsparungen möglich sind, ohne die Head-Tracking-Genauigkeit selbst zu beeinträchtigen. Tabelle 4 zeigt auch, dass die erforderlichen Energiekosten durch die Befolgung der Energiestrafe deutlich gesenkt werden könnten. Somit könnte die Bewegung mit geringerer Energie erzeugt werden, während die Aufgabenerfüllung erhalten bleibt.

Entwicklung des Korrelationskoeffizienten, relative Phase, beeinflusst durch unterschiedliche Energieverbrauchs-Strafparameter \(\gamma ~=\) 0, 5, 10, 15, 20, 25, 30, 35 und 40 in Gl. (6). Wobei die Bewegungsamplitude A des Zielpunkts in Gl. (5) beträgt 0,1 [m]. Die Knöchel- und Hüftsteifheit beträgt weiterhin 25 [Nm/rad] bzw. 125 [Nm/rad]. Und die Bewegungsverfolgungsfrequenz f des Zielpunkts in Gl. (5) beträgt 0,4 [Hz].

In diesem Szenario wird die Haltungskoordination zwischen Sprunggelenk und Hüftgelenk untersucht, indem das Energiegewicht in der Trainingsbelohnungsfunktion angepasst wird. Der Korrelationskoeffizient und die relative Phase werden herangezogen, um den Übergang der Koordinationsmodi zu quantifizieren. Die Entwicklung des Korrelationskoeffizienten und der relativen Phase, beeinflusst durch verschiedene Energiebenachteiligungsparameter \(\gamma ~=\) 0, 5, 10, 15, 20, 25, 30, 35 und 40 in Gl. (6) sind in Abb. 8 dargestellt. Wobei die Bewegungsamplitude A des Zielpunkts in Gl. (5) beträgt 0,1[m]. Die Knöchel- und Hüftsteifheit beträgt weiterhin 25 [Nm/rad] bzw. 125 [Nm/rad]. Und die Bewegungsverfolgungsfrequenz f des Zielpunkts in Gl. (5) beträgt 0,4 [Hz].

Mit zunehmendem Energiegewicht ändert sich der Korrelationskoeffizient zwischen Hüfte und Knöchel von einem negativen Wert zu einem positiven Wert. Der negative Korrelationskoeffizient für die Fälle des Energiegewichts \(\gamma ~=\) 0 und 5 in Gl. (6) drückt die gegenphasigen Moden zwischen Knöchel- und Hüftgelenk aus. Allerdings erscheinen die In-Phase-Moden zwischen den Knöchel- und Hüftgelenken für große Energiegewichte \(\gamma ~=\) 10, 15, 20, 25, 30, 35 und 40 in Gl. (6). Aus energiesparender Sicht verbraucht die In-Phase-Koordination weniger Energie als die Anti-Phase-Koordination zwischen Knöchel und Hüftgelenk, wenn es eine Lösung zur Bewältigung der gegebenen Gleichgewichts- und Kopfverfolgungsaufgabe gibt. Dann kann in diesem Fall davon ausgegangen werden, dass es zwei Arten von Lösungen gab: In-Phase und Anti-Phase, aber durch den Einsatz von Energieeinbußen konnte eine energieineffiziente Lösung entfernt werden, was dann zu einer In-Phase-Lösung führte. Anti-Phasen-Modi verbessern die adaptive Motorflexibilität, indem sie bei Tracking-Balancing-Aufgaben mehr Energie verbrauchen, selbst wenn es keine Lösung mit In-Phase-Modi gibt. Wenn jedoch sowohl In-Phase als auch Anti-Phase verfügbar sein könnten, ist es besser, die Anti-Phase-Lösung durch die Anwendung einer Energieeinbuße zu entfernen. Dies ist verständlich, wenn man den Zusammenhang zwischen Energieverbrauch und Aufgabenmanagement bedenkt.

Darüber hinaus nimmt die relative Phase mit zunehmendem Energieverbrauchsgewicht ab. Dies weist darauf hin, dass eine Änderung des Energieverbrauchs für Tracking-Balance-Aufgaben die kinematischen Merkmale der motorischen Koordination zwischen Knöchel und Hüftgelenk verändern kann. Wie oben erläutert, wechseln die Bewegungsmodi von gegenphasig zu gleichphasig, um bei der Bewältigung der jeweiligen Aufgabe energiesparende Ziele zu verfolgen. Darüber hinaus können wir den Schluss ziehen, dass die Energiebenachteiligung dazu tendiert, die Koordinationsmodi der Knöchel- und Hüftgelenke grundsätzlich in Richtung eines energieeffizienten motorischen Modus mit gleicher Phase zu ändern. Allerdings ist die Einstellung des Energiegewichts nicht sehr empfindlich für die Wahl des Haltungsmodus, da wir eine stabile Haltung beobachten können relative Phasenbeziehung, nachdem das Gewicht einen Wert von mehr als 10 hat. Das Energiestrafengewicht in der Belohnung ist ein Hyperparameter im Lernprozess. Wir konnten bestätigen, dass wir bei der Belohnung eine gewisse Berücksichtigung von Energieeinbußen benötigen, es handelt sich jedoch nicht um einen hochempfindlichen Faktor für die Reproduktion des konsistenten In-Phase- und Anti-Phase-Modus-Einsatzes.

Frühere Studien zeigen, dass sich die Gelenksteifheit beim Menschen hauptsächlich je nach Alter28,29, Körpergröße30,31 und Geschlecht32,33,34,35,36 unterscheidet. Die Gelenksteifheit ist ein wesentlicher Faktor für die Gleichgewichtskontrolle beim ruhigen Stehen28 und nimmt mit zunehmendem Alter bei der Haltungskontrolle zu29. Die Änderung der Hüftsteifheit kann sich auf den Bewegungsbereich auswirken, da die Hüftsteifheit ihr Erholungsdrehmoment ändert, um in die neutrale Position des Hüftgelenks zurückzukehren. Beispielsweise zeigt die aktuelle Studie37, dass die Beziehungen zwischen einem maximalen Bewegungsumfang und der Hüftsteifheit bei ruhigem Stehen bei üblichen Winkeln konsistent sind. Daher kann die Zunahme der Hüftsteifheit die Haltungskoordination von Hüfte und Knöchel bei Tracking-Balance-Aufgaben verändern. In dieser Studie schlagen wir vor, die linke und rechte Hüftsteifheit des humanoiden Modells gemeinsam zu ändern. Die acht Bedingungen werden hier basierend auf den biomechanischen Standards angegeben: 25, 50, 75, 100, 125, 150, 175 und 200 [Nm/rad]20,38,39,40.

Entwicklung des Korrelationskoeffizienten, relative Phase, beeinflusst durch unterschiedliche Hüftsteifigkeitswerte 25, 50, 75, 100, 125, 150, 175 bzw. 200 [Nm/rad]. Energieverbrauchsbenachteiligungsparameter \(\gamma\) in Gl. (6) beträgt 20. Die Bewegungsamplitude A des Zielpunkts in Gl. (5) beträgt 0,1 [m]. Die Knöchelsteifigkeit bleibt bei 25 [Nm/rad]. Und die Bewegungsverfolgungsfrequenz f des Zielpunkts in Gl. (5) beträgt 0,5 [Hz].

In diesem Szenario versuchen wir den Einfluss unterschiedlicher Hüftsteifheit auf die motorische Haltungskoordination zu verstehen. Wie oben erwähnt, kann die Steifigkeit eine wichtige mechanische Einschränkung sein, die die Bewegungsmodi verändern kann. Zwei Bewertungsindizes, wie der Korrelationskoeffizient und die relative Phase, wurden vorgeschlagen, um den Wechsel der Bewegungsmodi von gleichphasig zu gegenphasig zwischen Hüfte und Knöchel zu untersuchen. Die Entwicklung des Korrelationskoeffizienten und der relativen Phase, die durch unterschiedliche Hüftsteifigkeitswerte 25, 50, 75, 100, 125, 150, 175 und 200 [Nm/rad] beeinflusst werden, sind in Abb. 9 dargestellt. Wobei der Energieverbrauchsbenachteiligungsparameter \ (\gamma\) in Gl. (6) beträgt 20. Die Bewegungsamplitude A des Zielpunkts in Gl. (5) beträgt 0,1[m]. Die Knöchelsteifigkeit bleibt bei 25 [Nm/rad]. Und die Bewegungsverfolgungsfrequenz f des Zielpunkts in Gl. (5) beträgt 0,5 [Hz].

Mit zunehmender Hüftsteifigkeit ändert sich der Korrelationskoeffizient von Hüfte und Knöchel von einem negativen Wert zu einem positiven Wert. Bei kleinen Steifigkeitswerten wie 25, 50, 75 und 100 [Nm/rad] drückt die entsprechende negative Korrelation die gegenphasige Koordination zwischen Knöchel und Hüfte während der Tracking-Balance-Aufgaben aus. Eine positive Korrelation in Bezug auf die Hüftsteifigkeit 125, 150, 175 und 200 [Nm/rad] zeigt jedoch die phasengleichen Haltungsmodi zwischen Knöchel und Hüfte bei Tracking-Balance-Aufgaben. In Fällen mit höherer Steifigkeit gibt es ein unterstützendes Drehmoment, um in die neutrale Position zurückzukehren. Dann erscheint der Trägheitseffekt des Oberkörpers während der Kopfverfolgungsaufgabe relativ kleiner, als der In-Phase-Modus weiterhin verwendet werden kann. In Fällen mit erhöhter Frequenz ist der Antiphasenmodus erforderlich, um den Effekt der höheren Körperträgheit zu bewältigen. Bei höherer Steifigkeit verringert sich der Trägheitseffekt, dann kann immer noch eine In-Phase-Lösung verwendet werden. Wenn stattdessen die Gelenksteifheit abnimmt, steigt die Notwendigkeit, die Körperträgheit zu kompensieren, und die Koordinierung im Gegenphasenmodus ist stärker erforderlich. Dies ist sinnvoll, da eine gegenphasige motorische Koordination für kleine Steifheit große Bewegungsintensität rekrutieren muss. Im Gegensatz dazu rekrutiert eine gleichphasige motorische Koordination bei großer Steifheit eine geringe Intensität der Knöchel- und Hüftbewegungen. Die entsprechende grüne Kurve zeigt, dass mit zunehmender Hüftsteifigkeit die relative Phase abnimmt, was in Experimenten am Menschen beobachtet wurde17,19.

Bei Personen mit bestimmten Erkrankungen oder Verletzungen des Bewegungsapparates kann es während der klinischen Rehabilitation zu Veränderungen der Gelenksteifheit kommen, die sich auf bestimmte Gelenke auswirken. Beispielsweise kann es bei Personen mit Hüftarthrose aufgrund von Veränderungen des Gelenkknorpels oder der Gelenkkapsel zu einer erhöhten Steifheit der Hüfte kommen, während die Steifheit des Sprunggelenks unverändert bleiben kann. Ebenso kann es bei Personen, die sich einer Hüftoperation unterzogen haben, zu Veränderungen der Hüftsteifheit kommen. Das selbstorganisierende Haltungskontrollsystem, das die Rekrutierung von Hüft-Knöchel-Koordinationsmodi wie In-Phase und Anti-Phase beinhaltet, könnte dabei helfen, bessere Stehfähigkeiten im täglichen Leben dieser Personen zu verstehen.

In den vorherigen Abschnitten konnten wir ein selbstorganisierendes neuronales Netzwerk bilden, das abhängig von den gegebenen Aufgaben oder Bedingungen einen Moduswechsel einsetzt. Für den Lernprozess standen die Informationen und Erfahrungen zu den vorgegebenen Frequenzen zur Verfügung. Darüber hinaus wird das neuronale Netzwerk mit unterschiedlichen Frequenzen trainiert, diese wurden jedoch als feste Einstellung vorgegeben, nicht mit kontinuierlicher Variation der Frequenz.

In diesem Abschnitt wird anhand des erlernten neuronalen Netzwerkmodells das Verhalten bei kontinuierlicher Frequenzvariation im Hinblick auf die Haltungskoordination von Knöchel- und Hüftgelenken untersucht. Für die niedrige Frequenz wurde eine Inphase zwischen Hüfte und Knöchelgelenk verwendet. Mit der Erhöhung der Zielfrequenz wurde der Modus allmählich in die Antiphase verschoben, wie in Abb. 10 gezeigt, wobei die Frequenz im Laufe der Zeit linear anstieg. Die Wachstumsrate der Frequenz beträgt 25 s lang 0,036 Hz/s. Abb. 10 zeigt eine vorübergehende Änderung des Koordinationsmodus selbst für die kontinuierliche Frequenz, selbst wenn das neuronale Netzwerk nur mit den festen unterschiedlichen Einstellungen trainiert wird. Es weist darauf hin, dass das neuronale Netz auch für die neue Aufgabe über eine gewisse übertragbare Leistungsfähigkeit verfügt, die zum einen dann gegeben ist, wenn der Frequenzbereich innerhalb der erlebten Skala liegt. Die erzeugte Bewegung in Experiment 4 kann im Video bestätigt werden (Ergänzungsdatei 1).

Typisches Ergebnis für kontinuierliche Zielfrequenzvariation. (a) Gelenkwinkelvariation von Knöchel und Hüfte. (b) Die Korrelationskoeffizienten zwischen Sprunggelenk und Hüftgelenk mit zunehmender Zielfrequenz. Die Übergangsfrequenz beträgt 0,69 Hz. Die Fensterlänge zur Berechnung des Korrelationskoeffizienten beträgt 300 Zeitschritte. Die Wachstumsrate der Frequenz beträgt 0,036 Hz/s. Die Simulationszeit beträgt 25 s.

Durch die Erhöhung der Frequenz während der Kopfverfolgungsaufgabe ändert sich die Zielgeschwindigkeit in größerem Maßstab, was natürlich zu einer größeren Massenbeschleunigung und -verzögerung des Oberkörpers führt. Eine größere Massenbeschleunigung und -verzögerung des Oberkörpers kann auch bei erhöhter Oberkörpermasse selbst bei normaler Zielfrequenz auftreten. Da wir davon ausgehen, dass das erlernte neuronale Netzwerk den größeren Trägheitseffekt bewältigen kann, haben wir überprüft, wie sich das neuronale Netzwerk bei der neuen Aufgabe mit einer Zunahme der Oberkörpermasse verhalten kann. Es ist erwähnenswert, dass das neuronale Netzwerk nur mit unterschiedlichen Zielfrequenzen trainiert wird, wie im Abschnitt von Experiment 1 beschrieben.

Dieses Szenario befasst sich mit der Transferlernfähigkeit des selbstorganisierenden neuronalen Netzwerks auf die Haltungskoordination von Knöchel- und Hüftgelenken und wurde anhand des entsprechenden Korrelationskoeffizienten und der relativen Phase bewertet. Diese Indizes können den Übergang von Emergenzmodi und kinematischen Merkmalen veranschaulichen, wie in Experiment 1 diskutiert. Die Entwicklung des Korrelationskoeffizienten und der relativen Phase, die durch unterschiedliche zusätzliche Oberkörpermasse von 0,0 bis 4,0 [kg] beeinflusst werden, ist in Abb. dargestellt. 11. Die Bewegungsverfolgungsfrequenz f des Ziels in Gl. (5) beträgt 0,4 [Hz]. Bei dieser Zielfrequenz, da es sich um eine relativ niedrige Frequenz handelt, wird normalerweise der Inphase-Modus wie in Experiment 1 verwendet, wie im oberen Diagramm in Abb. 12 bestätigt werden kann. Während das hinzugefügte Oberkörpergewicht von 0,0 auf 4,0 [kg] steigt , der Korrelationskoeffizient von Hüfte und Knöchel sank von positiv auf negativ. Dies bedeutet, dass die Haltungskoordinationsmodi in einen Wechsel von gleichphasig zu gegenphasig übergingen. Es ist interessant, diesen selbstorganisierenden Moduswechsel auch dann zu beobachten, wenn die Aufgabe der Erhöhung der Oberkörpermasse neu dem neuronalen Netzwerk übertragen wird.

Viele Menschen gehen täglich mit Rucksäcken zur Arbeit oder zur Schule, das Gewicht dieser Rucksäcke variiert von Tag zu Tag. Das Tragen eines Rucksacks kann oft zu einer Zunahme der Oberkörpermasse führen, was die Gleichgewichtskontrolle und die Haltungsstabilität beeinträchtigen kann. Dies gilt insbesondere dann, wenn das Gewicht des Rucksacks vorher nicht bekannt ist. Daher haben wir dieses Szenario in die Studie einbezogen, um die Auswirkungen des Tragens einer Last auf dem Rücken auf die Gleichgewichtskontrolle und die Haltungsstabilität zu untersuchen, wobei der Schwerpunkt auf der motorischen Koordination zwischen Hüfte und Knöchel lag. Beispielsweise kann bei Personen mit Hüft- oder Knöchelverletzungen die motorische Koordination zwischen Hüfte und Knöchel beeinträchtigt sein, was das Sturzrisiko bei Aktivitäten des täglichen Lebens erhöhen kann. Indem wir die Auswirkungen des Rucksackgewichts auf die motorische Koordination zwischen Hüfte und Knöchel untersuchen, können wir Rehabilitationsprogramme besser entwickeln, die die Haltungsstabilität verbessern und das Sturzrisiko verringern.

Entwicklung des Korrelationskoeffizienten, relative Phase, beeinflusst durch das unterschiedliche Gewicht der zusätzlichen Last am Oberkörper. Wobei der Energieverbrauchs-Strafparameter \(\gamma\) in Gl. (6) beträgt 20. Die Knöchel- und Hüftsteifheit beträgt weiterhin 25 [Nm/rad] und 125 [Nm/rad]. Die Bewegungsverfolgungsfrequenz f des Zielpunkts in Gl. (5) beträgt 0,4 [Hz].

Gelenkwinkel von Knöchel und Hüfte bei unterschiedlichem Gewicht der Belastung. Wobei der Energieverbrauchs-Strafparameter \(\gamma\) in Gl. (6) beträgt 20. Die Knöchel- und Hüftsteifheit beträgt weiterhin 25 [Nm/rad] und 125 [Nm/rad]. Die Bewegungsverfolgungsfrequenz f des Ziels in Gl. (5) beträgt 0,4 [Hz].

Der Korrelationskoeffizient der Hüft- und Knöchelgelenkwinkel bei den gesamten Tracking-Balance-Aufgaben wird durch die Steifheit der Hüftgelenke von 25 bis 200 [Nm/rad] und die Bewegungsfrequenz f des Zielpunkts in Gleichung (1) bestimmt. (5) von 0,05 bis 0,5 [Hz].

In diesem Abschnitt diskutieren wir den Einfluss der kombinierten Einflussfaktoren Hüftsteifheit und Trackingfrequenz auf die Trackingleistung und den Wechsel der Koordinationsmuster der Knöchel- und Hüftgelenke. Wie oben in den vorherigen vier Experimenten diskutiert, haben mechanische und aufgabenbezogene Einschränkungen einen entscheidenden Einfluss auf die Selbstorganisation zwischen Sprunggelenk und Hüftgelenk. Daher möchten wir durch die Kombination dieser Einschränkungen weitere Fälle untersuchen. Hier nehmen wir als Beispiel die Hüftsteifheit und die Tracking-Frequenz unter Berücksichtigung mechanischer und aufgabenbezogener Einschränkungen.

Der Hauptzweck dieser Arbeit besteht darin, den Mechanismus neu entstehender Koordinationsmodi zwischen Knöchel- und Hüftgelenken zu untersuchen. Dabei wird der Korrelationskoeffizient der Hüft- und Sprunggelenkwinkel zur Bewertung der Koordinationsmodi herangezogen. Unter Berücksichtigung mechanischer und aufgabenbasierter Einschränkungen zur Erforschung des kontinuierlichen Übergangs zwischen In-Phase- und Anti-Phase-Modi werden zwei wesentliche Faktoren ausgewählt, darunter die Steifheit der Hüftgelenke und die Zielverfolgungsfrequenz, die die Phase der Haltungskoordination beeinflussen. In Abb. 13 ändert sich der Korrelationskoeffizient mit zunehmender Zielverfolgungsfrequenz und abnehmender Steifheit der Hüftgelenke von einem positiven zu einem negativen Wert, was bedeutet, dass die Haltungskoordination von gleichphasig zu gegenphasig wechselt. Mechanische Einschränkungen wie die Hüftsteifheit können die Phasenmodi beeinflussen, da der Trägheitseffekt des Oberkörpers bei reduzierter Hüftsteifheit stärker auftritt. Bei hoher Hüftsteifheit bleiben die Haltungskoordinationsmodi in Phase, während bei niedriger Hüftsteifheit die Gegenphase erhalten bleibt. Bei einer Hüftsteifigkeit im Bereich von 50 bis 150 [Nm/rad] werden die Koordinationsmodi stark von der Zielverfolgungsfrequenz beeinflusst. Darüber hinaus erfolgte der kontinuierliche Übergang von gleichphasig zu gegenphasig zwischen Knöchel und Hüftgelenk, wenn die Zielverfolgungsfrequenz bei fixierter Hüftsteifheit zunahm, wie in früheren Experimenten am Menschen erläutert17.

Wir haben auch die Auswirkung der Kopfbewegungsamplitude auf den Moduswechsel untersucht, der beobachtete Wechsel war jedoch nicht so deutlich wie der Frequenzeffekt. Wie bereits erläutert, spielen die Beschleunigung und Verzögerung der Masse eine entscheidende Rolle bei der Auslösung des Modenwechsels. Laut mechanischer Dynamik hat die Amplitude selbst einen relativ geringen Einfluss auf dieses Phänomen. Beim Menschen kann die Amplitude einen gewissen Einfluss haben, aber unser Fuß bietet als starrer Körper auf dem Boden keine große Greiffähigkeit. Infolgedessen ist der nachhaltige Amplitudenbereich nicht breit genug, um eine signifikante Änderung für den Amplitudentest zu beobachten. Um diesen Aspekt weiter zu untersuchen, benötigen wir Faktoren wie die Greiffunktion des Fußes mit den Fußfingern oder die Reibung.

In dieser Studie wurde vorgeschlagen und untersucht, ein selbstorganisierendes neuronales Netzwerk zu schaffen, das den Haltungsmodus adaptiv koordinieren kann, ohne ein vorheriges Körpermodell hinsichtlich Körperdynamik und -kinematik anzunehmen. Haltungskoordinationsmodi werden in Kopf-Ziel-Tracking-Aufgaben durch einen Deep-Reinforcement-Learning-Algorithmus reproduziert. Ein solches Ergebnis ist mit Modellen, die auf der Offline-Optimierung21 oder dem modellbasierten Steuerungsmodell20 basieren, schwer zu erzielen. Die Übergänge zwischen den Haltungskoordinationstypen, also In-Phase- und Anti-Phase-Koordinationsmodi, konnten durch Veränderung der Frequenzen des bewegten Ziels reproduziert werden (Abb. 6). Der Moduswechsel stimmte mit den in der Literatur berichteten Beobachtungen überein17,19.

Der Korrelationskoeffizient und die relative Phase zeigten die beiden Koordinationsmodi, Inphase und Antiphase der Knöchel- und Hüftgelenke. Diese Indizes können die räumlichen Merkmale der Knöchel- und Hüftgelenkwinkel anzeigen. Die Entstehung der Haltungsmodalität wurde durch mechanische und aufgabenbezogene Einschränkungen im Hinblick auf Hüftsteifheit, Energieverbrauch und Häufigkeit der Zielverfolgung beeinflusst. Aus dem Ergebnis von Abb. 8 können wir schließen, dass die Energieeinbuße tendenziell dazu führt, dass sich die Koordinationsmodi der Knöchel- und Hüftgelenke in Richtung eines In-Phase-Modus ändern. Unter energiesparenden Gesichtspunkten verbraucht die In-Phase-Koordination weniger Energie als die Anti-Phase-Koordination zwischen Sprung- und Hüftgelenk, wenn es eine Lösung gibt. Die Aufgabe beinhaltet jedoch einen komplexen Massenträgheitseffekt, das Hüftgelenk muss intensiv bewegt werden und wechselt dann in den Gegenphasenmodus. Es konnte ebenfalls bestätigt werden, dass Körperparameter wie die Steifheit des Hüftgelenks den Moduswechsel beeinflussen. Wenn die Gelenksteifheit abnimmt, steigt die Notwendigkeit, die Körperträgheit zu kompensieren, und die Koordination im Gegenphasenmodus ist stärker erforderlich (Abb. 9).

Schließlich wurde der kontinuierliche Übergang zwischen Haltungskoordinationsmodi realisiert, der die erlernte Anpassungsfähigkeit des neuronalen Netzwerks für eine neue Aufgabe unter Beibehaltung des selbstorganisierten Moduswechsels demonstrieren konnte. Selbst wenn das neuronale Netzwerk nicht unter kontinuierlichen Frequenzschwankungen trainiert wird, könnte es sich an die zeitlich variierenden Änderungen der Zielfrequenz anpassen und gleichzeitig einen konsistenten Moduswechsel von gleichphasig zu gegenphasig beibehalten. Darüber hinaus haben wir in der Erwartung, dass das erlernte neuronale Netzwerk den größeren Trägheitseffekt bewältigen kann, überprüft, wie sich das neuronale Netzwerk bei der neuen Aufgabe mit einer Zunahme der Oberkörpermasse verhalten kann. Es ist erwähnenswert, dass das neuronale Netzwerk nur mit unterschiedlichen Zielfrequenzen trainiert wird. Für die erhöhte Trägheit des Oberkörpers wurde der Modus selbstorganisierend in die Gegenphase geändert.

Diese Arbeit bietet einen neuen Ansatz für das computergestützte motorische Lernen des Menschen und veranschaulicht die Haltungsmodalität der Selbstorganisation für Head-Tracking-Aufgaben. Für zukünftige Forschungen könnten wir die kontinuierliche Koordinationsdynamik zwischen den Knöchel- und Hüftgelenken unter anderen Einschränkungen oder Aufgaben wie Körpergröße und Fettleibigkeit sowie die funktionelle Reichweite im Stehen untersuchen. Darüber hinaus können ganze Multisegmente, einschließlich Hals-, Arm-, Hüft-, Knie- und Knöchelgelenke, für die Körpermodellierung in Betracht gezogen werden, um die aktuelle Studie in Richtung vollständiger Ganzkörperaufgaben zu verbessern. Schließlich ist der Gleichphasen- und Gegenphasenwechsel eines der Synchronisationsphänomene in mechanischen Systemen. Eine allgemeinere Perspektive auf synergetisch synchronisierte Schwingungen ist ebenfalls eine wichtige zukünftige Forschungsrichtung, um ein dynamisches Gleichgewicht in natürlichen mechanischen Systemen herbeizuführen.

Alle zur Durchführung der Analysen verwendeten Codes sind im Repository verfügbar. https://github.com/Li-Guanda/SwingHumanoid.

Winter, D. Menschliches Gleichgewicht und Haltungskontrolle beim Stehen und Gehen. Ganghaltung 3(4), 193–214 (1995).

Artikel Google Scholar

Nashner, LM Die Organisation menschlicher Haltungsbewegungen: Eine formale Grundlage und experimentelle Synthese. Verhalten. Gehirnwissenschaft. 8(1), 135–150 (1985).

Artikel Google Scholar

Horak, FB & Nashner, LM Zentrale Programmierung von Haltungsbewegungen: Anpassung an veränderte Stützflächenkonfigurationen. J. Neurophysiol. 55(6), 1369–1381 (1986).

Artikel CAS PubMed Google Scholar

Horak, FB, Nashner, LM & Diener, HC Haltungsstrategien im Zusammenhang mit somatosensorischem und vestibulärem Verlust. Exp. Gehirnres. 82(1), 167–177 (1990).

Artikel CAS PubMed Google Scholar

Shen, K., Chemori, A. & Hayashibe, M. Klassifizierung von Strategien zur Wiederherstellung des menschlichen Gleichgewichts durch kinematische motorische Synergieanalyse. In 44. jährliche internationale Konferenz der IEEE Engineering in Medicine and Biology Society, EMBC 2022, S. 1792–1796 (2022).

Kuo, AD & Zajac, FE Menschliche Stehhaltung: Mehrgelenkige Bewegungsstrategien basierend auf biomechanischen Einschränkungen. Prog. Gehirnres. 97(C), 349–358 (1993).

Artikel CAS PubMed Google Scholar

Kuo, AD Ein optimales Kontrollmodell zur Analyse des menschlichen Haltungsgleichgewichts. IEEE Trans. Biomed. Ing. 42(1), 87–101 (1995).

Artikel ADS CAS PubMed Google Scholar

Shen, K., Chemori, A. & Hayashibe, M. Menschenähnliche Gleichgewichtswiederherstellung basierend auf einer numerischen modellprädiktiven Kontrollstrategie. IEEE Access 8, 92050–92060 (2020).

Google Scholar

Shen, K., Chemori, A. & Hayashibe, M. Wirksamkeitsbewertung der Armnutzung für die Wiederherstellung des menschlichen Gleichgewichts im ruhigen Stehen durch nichtlineare modellprädiktive Steuerung. In 3rd International Conference on Control and Robots, ICCR 2020, S. 150–153 (2020).

Shen, K., Chemori, A. & Hayashibe, M. Reproduktion der menschlichen Armstrategie und ihr Beitrag zur Wiederherstellung des Gleichgewichts durch modellprädiktive Kontrolle. Vorderseite. Neuroroboter. 15. Mai (2021).

Galgon, AK & Shewokis, PA Unter Verwendung der mittleren absoluten relativen Phase, der Abweichungsphase und der relativen Punktschätzungsphase zur Messung der Haltungskoordination in einer seriellen Greifaufgabe. J. Sportwissenschaft. Med. 15(1), 131–141 (2016).

PubMed PubMed Central Google Scholar

Bernshtein, N. The Co-Ordination and Regulation of Movement (Pergamon Press, Oxford, 1967).

Google Scholar

Bonnet, T. & Lepeut, M. Von Personen mit peripheren Defiziten übernommen: Eine Rezension. J. Mot. Verhalten. 43(4), 219–228 (2011).

Artikel Google Scholar

Aramaki, Y. et al. Reziproke Winkelbeschleunigung der Knöchel- und Hüftgelenke beim ruhigen Stehen beim Menschen. Exp. Gehirnres. 137(1), 463–473 (2001).

Artikel Google Scholar

Boonstra, TA, Schouten, AC & Van Der Kooij, H. Identifizierung des Beitrags der Knöchel- und Hüftgelenke zur multisegmentalen Gleichgewichtskontrolle. J. NeuroEng. Rehabil.10(23) (2013).

Noamani, A., Lemay, JF, Musselman, KE & Rouhani, H. Haltungskontrollstrategie nach unvollständiger Rückenmarksverletzung: Auswirkung sensorischer Eingaben auf die Koordination der Rumpf-Bein-Bewegung. J. Neuroeng. Rehabilitation. 17(1), 1–12 (2020).

Artikel Google Scholar

Bardy, BG, Marin, L., Stoffregen, TA & Bootsma, RJ Haltungskoordinationsmodi werden als aufkommende Phänomene betrachtet. J. Exp. Psychol. Summen. Wahrnehmung. Ausführen. 25(5), 1284–1301 (1999).

Artikel CAS PubMed Google Scholar

Marin, L., Bardy, BG, Baumberger, B., Flückiger, M. & Stoffregen, TA Interaktion zwischen Aufgabenanforderungen und Oberflächeneigenschaften bei der Kontrolle einer zielorientierten Haltung. Summen. Mov. Wissenschaft. 18(1), 31–47 (1999).

Artikel Google Scholar

Bardy, BG, Oullier, O., Bootsma, RJ & Stoffregen, TA Dynamik menschlicher Haltungsübergänge. J. Exp. Psychol. Summen. Wahrnehmung. Ausführen. 28(3), 499–514 (2002).

Artikel PubMed Google Scholar

Bonnet, V. et al. Ein strukturell optimales Kontrollmodell zur Vorhersage und Analyse der menschlichen Haltungskoordination. J. Biomech. 44(11), 2123–2128 (2011).

Artikel PubMed Google Scholar

Martin, L., Cahouët, V., Ferry, M. & Fouque, F. Optimierungsmodellvorhersagen für Haltungskoordinationsmodi. J. Biomech. 39(1), 170–176 (2006).

Artikel PubMed Google Scholar

Schulman, J., Wolski, F., Dhariwal, P., Radford, A. & Klimov, O. Proximale Richtlinienoptimierungsalgorithmen. arXiv:1707.06347[cs.LG] (2017).

Makoviychuk, V., Wawrzyniak, L., Guo, Y., Lu, M., Storey, K., Macklin, M., Hoeller, D., Rudin, N., Allshire, A., Handa, A. & et al. Isaac Gym: Hochleistungs-GPU-basierte Physiksimulation für das Roboterlernen. arXiv-Vorabdruck arXiv:2108.10470[cs.RO] (2021).

Houdijk, H., Fickert, R., van Velzen, J. & van Bennekom, C. Die Energiekosten für die Gleichgewichtskontrolle beim aufrechten Stehen. Ganghaltung 30(2), 150–154 (2009).

Artikel PubMed Google Scholar

Bardy, BG, Oullier, O., Lagarde, J. & Stoffregen, TA Über Störungen und Musterkoexistenz in der Dynamik der Haltungskoordination. J. Mot. Verhalten. 39(4), 326–336 (2007).

Artikel PubMed Google Scholar

Sofianidis, G., Elliott, MT, Wing, AM & Hatzitaki, V. Interaktion zwischen zwischenmenschlicher und Haltungskoordination während frequenzskalierter rhythmischer Schwankungen: Die Rolle der Tanzkompetenz. Ganghaltung 41(1), 209–216 (2015).

Artikel PubMed Google Scholar

Winter, DA, Patla, AE, Prince, F., Ishac, M. & Gielo-Perczak, K. Steifheitskontrolle des Gleichgewichts im ruhigen Stehen. J. Neurophysiol. 80, 1211–1221 (1998).

Artikel CAS PubMed Google Scholar

Cenciarini, M., Loughlin, PJ, Sparto, PJ & Redfern, MS Steifheit und Dämpfung der Haltungskontrolle nehmen mit zunehmendem Alter zu. IEEE Trans. Biomed. Ing. 57, 267–275 (2010).

Artikel PubMed Google Scholar

Nguyen, AP et al. Einfluss von Alter und Körpergröße auf die Viskoelastizität des Handgelenks bei gesunden Teilnehmern im Alter von 3 bis 90 Jahren und Zuverlässigkeitsbewertung. Vorderseite. Sport Aktiv Liv. 2, 4 (2020).

Google Scholar

Nguyen, AP, Detrembleur, C., Fisette, P., Selves, C. & Mahaudens, P. Myotonpro ist ein gültiges Gerät zur Beurteilung der biomechanischen Steifheit des Handgelenks bei gesunden jungen Erwachsenen. Vorderseite. Sport Aktiv Liv. 4, 2 (2022).

Google Scholar

Nishiwaki, M., Kurobe, K., Kiuchi, A., Nakamura, T. & Matsumoto, N. Geschlechtsunterschiede in der Beziehung zwischen Flexibilität und Arteriensteifheit und ihre Anwendung zur Diagnose von Arterienversteifung: Querschnittsbeobachtungsstudie. PLoS ONE 11, 9 (2016).

Google Scholar

Fouré, A., Cornu, C., McNair, PJ & Nordez, A. Geschlechtsunterschiede sowohl in den aktiven als auch in den passiven Teilen der Plantarbeugerreihe, der elastischen Komponentensteifigkeit und den geometrischen Parametern des Muskel-Sehnen-Komplexes. J. Orthop. Res. 30(5), 707–712 (2012).

Artikel PubMed Google Scholar

Ahimastos, AA, Formosa, M., Dart, AM & Kingwell, BA Geschlechtsspezifische Unterschiede bei der Steifheit großer Arterien vor und nach der Pubertät. J. Clin. Endokrinol. Metab. 88(11), 5375–5380 (2003).

Artikel CAS PubMed Google Scholar

Padua, DA, Garcia, CR, Arnold, BL & Granata, KP Geschlechtsspezifische Unterschiede in der Beinsteifheit und Strategie zur Rekrutierung der Steifheit beim zweibeinigen Hüpfen. J. Mot. Verhalten. 37, 111–126 (2005).

Artikel PubMed Google Scholar

DuPont, JJ, Kenney, RM, Patel, AR & Jaffe, IZ Geschlechtsunterschiede in den Mechanismen der arteriellen Steifheit. Br. J. Pharmacol. 176, 4208–4225 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Elliott, BJ, Hookway, N., Tate, BM & Hines, MG Korreliert die passive Hüftsteifheit oder der Bewegungsumfang mit der Wirbelsäulenkrümmung und -haltung beim ruhigen Stehen? Ganghaltung 85, 273–279 (2021).

Artikel PubMed Google Scholar

van der Kooij, H., Fricke, SS, Veld, RC vt, Prieto, AV, Keemink, AQL, Schouten, AC & van Asseldonk, EHF Ein Gerät und eine Methode zur Identifizierung der Hüft-, Knie- und Knöchelgelenkimpedanz beim Gehen (2021) .

Loram, ID & Lakie, M. Direkte Messung der menschlichen Knöchelsteifigkeit beim ruhigen Stehen: Die intrinsische mechanische Steifigkeit reicht für die Stabilität nicht aus. J. Physiol. 545(3), 1041–1053 (2002).

Artikel CAS PubMed PubMed Central Google Scholar

Koopman, B., Van Asseldonk, EH & Van Der Kooij, H. Schätzung der menschlichen Mehrgelenkdynamik in Hüfte und Knie mit dem LOPES-Gangtrainer. IEEE Trans. Rauben. 32(4), 920–932 (2016).

Artikel Google Scholar

Hayashibe, M. & Shimoda, S. Synergetisch synchronisierte Schwingung durch verteilte neuronale Integratoren zur Herbeiführung eines dynamischen Gleichgewichts in Energiedissipationssystemen. Wissenschaft. Rep. 12, 17163 (2022).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Referenzen herunterladen

Diese Arbeit wurde durch das JSPS Grant-in-Aid for Scientific Research on Innovative Areas Hyper-Adaptability Project unter der Fördernummer 22H04764 unterstützt.

Diese Autoren haben gleichermaßen beigetragen: Keli Shen und Guanda Li.

Abteilung für Robotik, Graduate School of Engineering, Tohoku-Universität, Sendai, Japan

Keli Shen, Guanda Li und Mitsuhiro Hayashibe

LIRMM, Universität Montpellier, CNRS, Montpellier, Frankreich

Ahmed Chemori

Sie können diesen Autor auch in PubMed Google Scholar suchen

KS und GL haben gleichermaßen zu der Arbeit beigetragen und sollten als Co-Erstautoren betrachtet werden. KS und GL haben den Code implementiert und das Manuskript geschrieben. AC betreute den Aspekt der Steuerungstechnik. MH konzipierte das Forschungsdesign und schrieb das Manuskript. Alle Autoren haben das Manuskript überprüft.

Korrespondenz mit Mitsuhiro Hayashibe.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Ergänzende Informationen 1.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Shen, K., Li, G., Chemori, A. et al. Selbstorganisierendes neuronales Netzwerk zur Reproduktion des menschlichen Haltungsmoduswechsels durch tiefgreifendes Verstärkungslernen. Sci Rep 13, 8966 (2023). https://doi.org/10.1038/s41598-023-35886-y

Zitat herunterladen

Eingegangen: 19. Januar 2023

Angenommen: 25. Mai 2023

Veröffentlicht: 02. Juni 2023

DOI: https://doi.org/10.1038/s41598-023-35886-y

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein gemeinsam nutzbarer Link verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.