Hmmm, es scheint, diese quoteasy to implementquot Funktion ist eigentlich ziemlich einfach, falsch zu bekommen und hat eine gute Diskussion über Speicher-Effizienz gefördert. I39m glücklich, aufblasen zu haben, wenn es bedeutet, dass etwas nach rechts gemacht worden ist. Ndash Richard NumPys Mangel an einer bestimmten Domain-spezifische Funktion ist vielleicht aufgrund der Core Teams Disziplin und Treue zu NumPys Prime-Direktive: bieten einen N-dimensionalen Array-Typ. Sowie Funktionen zum Erstellen und Indizieren dieser Arrays. Wie viele grundlegende Ziele, diese ist nicht klein, und NumPy macht es brillant. Das (viel) grßere SciPy enthält eine viel grßere Sammlung von domänenspezifischen Bibliotheken (sogenannte Unterpakete von SciPy-Devs), beispielsweise numerische Optimierung (Optimierung), Signalverarbeitung (Signal) und Integralrechnung (integrieren). Meine Vermutung ist, dass die Funktion, die Sie nach ist in mindestens einem der SciPy-Unterpakete (scipy. signal vielleicht) aber ich würde zuerst in der Sammlung von SciPy Scikits suchen. Identifizieren die relevanten Scikit (s) und suchen die Funktion von Interesse dort. Scikits sind unabhängig voneinander entwickelte Pakete, die auf NumPySciPy basieren und auf eine spezielle technische Disziplin gerichtet sind (z. B. scikits-image, scikits-learn etc.) Einige davon waren (vor allem das geniale OpenOpt für numerische Optimierung) hoch angesehene, ausgereifte Projekte Bevor er sich unter der relativ neuen Scikits-Rubrik befindet. Auf der Homepage der Scikits sind über 30 solcher Scikits aufgelistet. Obwohl mindestens einige von ihnen nicht mehr unter aktiver Entwicklung sind. Nach diesem Rat würden Sie zu scikits-timeseries führen, aber dieses Paket ist nicht mehr unter aktiver Entwicklung In Wirklichkeit ist Pandas geworden, AFAIK, die de facto NumPy-basierte Zeitreihen-Bibliothek. Pandas hat mehrere Funktionen, die verwendet werden können, um einen gleitenden Durchschnitt zu berechnen, der einfachste ist wahrscheinlich rollingmean. Die Sie so verwenden: Nun, rufen Sie einfach die Funktion Rolling Mean Passing in der Serie Objekt und eine Fenstergröße. Die in meinem Beispiel unten ist 10 Tage. Ob es funktioniert hat - z. Verglichen Werte 10-15 in der ursprünglichen Serie gegenüber der neuen Serie geglättet mit rollenden Mittel Die Funktion Rolling Mean, zusammen mit etwa ein Dutzend oder so andere Funktion sind informell gruppiert in der Pandas-Dokumentation unter der Rubrik Moving-Fenster-Funktionen eine zweite, verwandte Gruppe von Funktionen In Pandas wird als exponentiell gewichtete Funktionen bezeichnet (zB ewma, die einen exponentiell verschobenen gewichteten Durchschnitt berechnet). Die Tatsache, daß diese zweite Gruppe nicht in den ersten (bewegten Fensterfunktionen) enthalten ist, liegt vielleicht daran, daß die exponentiell gewichteten Transformationen sich nicht auf ein Fenster mit fester Länge verlassen9.7. Statistik 8212 Mathematische Statistikfunktionen Dieses Modul bietet Funktionen zum Berechnen der mathematischen Statistik numerischer (Real-Wert) Daten. Sofern nicht explizit anders angegeben, unterstützen diese Funktionen int. schweben. Decimal. Decimal und fractions. Fraction. Das Verhalten mit anderen Typen (ob im numerischen Tower oder nicht) wird derzeit nicht unterstützt. Mischtypen sind auch undefiniert und implementierungsabhängig. Wenn Ihre Eingabedaten aus gemischten Typen bestehen, können Sie map () verwenden, um ein konsistentes Ergebnis zu gewährleisten, z. B. Karte (float, Eingabedaten). 9.7.1. Mittelwerte und Maße der zentralen Lage Diese Funktionen berechnen einen mittleren oder typischen Wert aus einer Population oder Stichprobe. 9.7.3. Funktionsbeschreibung Hinweis: Die Funktionen erfordern keine Sortierung der Daten. Zum Lesen der Bequemlichkeit zeigen die meisten Beispiele jedoch sortierte Sequenzen. Gibt das arithmetische Mittelwert der Daten zurück, die eine Folge oder ein Iterator sein können. Das arithmetische Mittel ist die Summe der Daten dividiert durch die Anzahl der Datenpunkte. Es ist gemeinhin als 8220Der Durchschnitt8221, obwohl es nur eine von vielen verschiedenen mathematischen Durchschnitten ist. Es ist ein Maß für die zentrale Lage der Daten. Einige Anwendungsbeispiele: Der Mittelwert wird stark von Ausreißern beeinflusst und ist kein robuster Schätzer für die zentrale Lage: Der Mittelwert ist nicht notwendigerweise ein typisches Beispiel für die Datenpunkte. Für robustere, wenn auch weniger effiziente Maßnahmen der zentralen Lage siehe median () und mode (). (In diesem Fall bezieht sich 8220efficient8221 eher auf den statistischen Wirkungsgrad als auf die rechnerische Effizienz.) Der Stichprobenmittelwert gibt eine unvoreingenommene Schätzung des wahren Populationsmittels, was bedeutet, dass im Mittel über alle möglichen Proben die mittlere (Stichprobe) auf der Wahrheit konvergiert Durchschnitt der Gesamtbevölkerung. Wenn Daten die gesamte Population repräsentieren und nicht eine Probe, dann bedeutet mean (data) äquivalent zur Berechnung des wahren Populationsmittels. Statistiken. Harmonicmean (data) Gibt das harmonische Mittel der Daten zurück. Eine Folge oder einen Iterator von reellen Zahlen. Das harmonische Mittel, gelegentlich auch das Subkonträrmittel, ist der Kehrwert des arithmetischen Mittels () der Kehrwerte der Daten. Das harmonische Mittel der drei Werte a. B und c entspricht 3 (1a 1b 1c). Das harmonische Mittel ist ein Mittelwert, ein Maß für die zentrale Lage der Daten. Häufig ist es sinnvoll, Mittelungen zu berechnen, die Geschwindigkeiten oder Geschwindigkeiten sind, beispielsweise Geschwindigkeiten. Zum Beispiel: Angenommen, ein Investor kauft einen gleichen Wert der Aktien in jedem der drei Unternehmen, mit PE (Priceearning) - Verhältnisse von 2,5, 3 und 10. Was ist die durchschnittliche PE-Verhältnis für die Investor8217s Portfolio Mit dem arithmetischen Mittel würde einen Durchschnitt von Etwa 5,177, was zu hoch ist. StatisticsError wird angehoben, wenn die Daten leer sind oder jedes Element kleiner als Null ist. Neu in Version 3.6. Statistiken. Median (data) Gibt den Median (Mittelwert) der numerischen Daten zurück, wobei die gemeinsame Methode 8220mean der mittleren two8221 verwendet wird. Wenn die Daten leer sind, wird StatisticsError ausgelöst. Daten können eine Sequenz oder ein Iterator sein. Der Median ist ein robustes Maß an zentraler Lage und wird weniger durch das Vorhandensein von Ausreißern in Ihren Daten beeinflusst. Wenn die Anzahl der Datenpunkte ungerade ist, wird der mittlere Datenpunkt zurückgegeben: Wenn die Anzahl der Datenpunkte gerade ist, wird der Median interpoliert, indem der Mittelwert der beiden mittleren Werte genommen wird: Dies ist geeignet, wenn Ihre Daten diskret sind Dass es sich bei dem Median nicht um einen tatsächlichen Datenpunkt handelt. Statistiken. Medianlow (data) Gibt den niedrigen Mittelwert der numerischen Daten zurück. Wenn Daten leer sind, wird StatisticsError ausgelöst. Daten können eine Sequenz oder ein Iterator sein. Der niedere Median ist immer Bestandteil des Datensatzes. Wenn die Anzahl der Datenpunkte ungerade ist, wird der Mittelwert zurückgegeben. Wenn es gerade ist, wird der kleinere der beiden Mittelwerte zurückgegeben. Verwenden Sie den niedrigen Medianwert, wenn Ihre Daten diskret sind, und Sie möchten, dass der Median ein tatsächlicher Datenpunkt ist und nicht interpoliert wird. Statistiken. Medianhigh (data) Gibt den hohen Median der Daten zurück. Wenn Daten leer sind, wird StatisticsError ausgelöst. Daten können eine Sequenz oder ein Iterator sein. Der hohe Median ist immer Bestandteil des Datensatzes. Wenn die Anzahl der Datenpunkte ungerade ist, wird der Mittelwert zurückgegeben. Wenn es gerade ist, wird der größere der beiden mittleren Werte zurückgegeben. Verwenden Sie den hohen Median, wenn Ihre Daten diskret sind, und Sie möchten, dass der Median ein tatsächlicher Datenpunkt ist und nicht interpoliert wird. Statistiken. Mediangrouped (Datenintervall1) Liefert den Median der gruppierten kontinuierlichen Daten, berechnet als 50. Perzentil, mittels Interpolation. Wenn Daten leer sind, wird StatisticsError ausgelöst. Daten können eine Sequenz oder ein Iterator sein. Im folgenden Beispiel werden die Daten gerundet, so dass jeder Wert den Mittelpunkt der Datenklassen darstellt, z. B. 1 ist der Mittelpunkt der Klasse 0.582111.5, 2 ist der Mittelpunkt von 1.582112.5, 3 ist der Mittelpunkt von 2.582113.5 usw. Mit den angegebenen Daten fällt der Mittelwert irgendwo in der Klasse 3.582114.5 und Interpolation Wird verwendet, um es zu schätzen: Optionales Argumentintervall stellt das Klassenintervall dar und ist standardmäßig auf 1. Das Ändern des Klassenintervalls wird natürlich die Interpolation ändern: Diese Funktion überprüft nicht, ob die Datenpunkte mindestens auseinander liegen. CPython-Implementierungsdetails: Unter bestimmten Umständen kann mediangrouped () Datenpunkte zu Floats zwingen. Dieses Verhalten wird sich wahrscheinlich in Zukunft ändern. 8220Statistik für die Behavioral Sciences8221, Frederick J Gravetter und Larry B Wallnau (8. Auflage). Berechnung des Medianwertes. Die SSMEDIAN-Funktion in der Gnome-Kalkulationstabelle, einschließlich dieser Diskussion. Geben Sie den gebräuchlichsten Datenpunkt aus diskreten oder nominalen Daten zurück. Der Modus (wenn er existiert) ist der typischste Wert und ist ein robustes Maß für die zentrale Lage. Wenn Daten leer sind oder nicht genau ein allgemeinster Wert ist, wird StatisticsError ausgelöst. Modus nimmt diskrete Daten an und gibt einen einzelnen Wert zurück. Dies ist die Standardbehandlung des Modus, wie sie in Schulen allgemein gelehrt wird: Der Modus ist einzigartig, da er die einzige Statistik ist, die auch für nominale (nicht numerische) Daten gilt: Geben Sie die Populationsstandardabweichung (die Quadratwurzel der Populationsabweichung) zurück ). Siehe pvariance () für Argumente und andere Details. Geben Sie die Bevölkerungsabweichung der Daten zurück. Eine nicht-leere iterable von reellwertigen Zahlen. Eine Varianz oder ein zweites Moment um den Mittelwert ist ein Maß für die Variabilität (Verbreitung oder Dispersion) von Daten. Eine große Varianz gibt an, dass die Daten verteilt sind, eine kleine Varianz zeigt an, dass sie eng um den Mittelpunkt gruppiert ist. Wenn das optionale zweite Argument mu gegeben ist, sollte es der Mittelwert der Daten sein. Wenn sie fehlt oder Keine (die Voreinstellung), wird der Mittelwert automatisch berechnet. Mit dieser Funktion berechnen Sie die Varianz der Gesamtbevölkerung. Um die Varianz einer Stichprobe abzuschätzen, ist die Varianz () - Funktion in der Regel eine bessere Wahl. Wenn Sie den Mittelwert Ihrer Daten bereits berechnet haben, können Sie ihn als optionales zweites Argument mu übergeben, um eine Neuberechnung zu vermeiden: Diese Funktion versucht nicht zu überprüfen, ob Sie den tatsächlichen Mittelwert als mu überschritten haben. Die Verwendung willkürlicher Werte für mu kann zu ungültigen oder unmöglichen Ergebnissen führen. Dezimalstellen und Fraktionen werden unterstützt: Aufgerufen mit der Gesamtbevölkerung ergibt dies die Bevölkerungsabweichung. Wenn sie stattdessen auf eine Probe aufgerufen wird, ist dies die voreingenommene Probenvarianz s, die auch als Varianz mit N Freiheitsgraden bekannt ist. Wenn Sie irgendwie die wahre Bevölkerungszahl kennen, können Sie diese Funktion verwenden, um die Varianz einer Stichprobe zu berechnen, wobei die bekannte Bevölkerungszahl als zweites Argument angegeben wird. Unter der Voraussetzung, dass die Datenpunkte repräsentativ sind (z. B. unabhängig und identisch verteilt), ist das Ergebnis eine unvoreingenommene Schätzung der Populationsabweichung. Geben Sie die Standardabweichung (die Quadratwurzel der Probenvarianz) zurück. Siehe Varianz () für Argumente und andere Details. Statistiken. Varianz (Daten xbarNone) Liefert die Stichprobenabweichung der Daten. Eine iterable von mindestens zwei reellwertigen Zahlen. Eine Varianz oder ein zweites Moment um den Mittelwert ist ein Maß für die Variabilität (Verbreitung oder Dispersion) von Daten. Eine große Varianz gibt an, dass die Daten verteilt sind, eine kleine Varianz zeigt an, dass sie eng um den Mittelpunkt gruppiert ist. Wenn das optionale zweite Argument xbar angegeben wird, sollte es der Mittelwert der Daten sein. Wenn sie fehlt oder Keine (die Voreinstellung), wird der Mittelwert automatisch berechnet. Verwenden Sie diese Funktion, wenn Ihre Daten ein Beispiel aus einer Population sind. Um die Varianz der Gesamtbevölkerung zu berechnen, siehe pvariance (). Raises StatisticsError, wenn Daten weniger als zwei Werte haben. Wenn Sie den Mittelwert Ihrer Daten bereits berechnet haben, können Sie sie als optionales zweites Argument xbar übergeben, um eine Neuberechnung zu vermeiden: Diese Funktion versucht nicht zu überprüfen, ob Sie den aktuellen Mittelwert als xbar übergeben haben. Die Verwendung von beliebigen Werten für xbar kann zu ungültigen oder unmöglichen Ergebnissen führen. Dezimal - und Fraktionswerte werden unterstützt: Dies ist die Musterabweichung s mit Bessel8217s-Korrektur, auch bekannt als Varianz mit N-1 Freiheitsgraden. Unter der Voraussetzung, dass die Datenpunkte repräsentativ sind (z. B. unabhängig und identisch verteilt), sollte das Ergebnis eine unvoreingenommene Schätzung der wahren Populationsabweichung sein. Wenn Sie irgendwie wissen, die tatsächliche Bevölkerung Mittel, sollten Sie es an die pvariance () - Funktion als den mu-Parameter, um die Varianz eines Beispiels zu erhalten. 9.7.4. Ausnahmen Eine einzige Ausnahme ist definiert: Ausnahmestatistik. StatisticsError Unterklasse von ValueError für statistische Ausnahmen.
No comments:
Post a Comment