Overfitting versus onderfitting: het wordt compleet met señales, oorzaken en oplossingen

Laatste update: 11/23/2025
Auteur: C Bronpad
  • Overfitting: veel variatie, onthoud de onderneming en val op nieuwe data; Dit geldt voor regularisatie, validatie, uitval, meer data en vroegtijdig stoppen.
  • Onderfitting: alt sesgo, incapaz de aprender patrones; als het meer complejidad is, zijn de meeste gebeurtenissen, de grootste vindingrijkheid van de karakters en de regularisatie ervan.
  • Sesgo–varianza: evenwichtskritisch; complejidad verminderen de sessies pero aumenta variatie, en vice versa.
  • Praktische oefeningen: datakalibratie, normalisatie, monitordrift, k-fold, ensembles (bagging/boosting) en het overbrengen van leren.

Vergelijkende overfitting en underfitting

Met nieuwe machine learning-modellen kunnen we steeds duidelijker maken: die functioneren met de gegevens die je kunt zien en nu, met de nieuwe gegevens. Dit evenwicht komt tot stand in de geschiedenis en in het algemeen in het geheugen Er is een verschil tussen een prototype en een betrouwbaar productiesysteem.

Het probleem is dat dit tussenliggende punt niet triviaal is. De klassieke gevolgen van dit alles: overfitting (sobreajuste) en underfitting (subajuste). De eerste keer dat het model verschijnt, zijn de bedrijfsgegevens die de ruido met het volgende verwarren; Op de tweede plaats is het model eenvoudig (of is het een limiet) dat u de basispatroon niet kunt gebruiken. In de volgende secties zijn de oorzaken, problemen, ejemplos, de relatie met de sesgo en de variatie, en een arsenaal aan praktische technieken om dit geval te corrigeren.

Wat is overfitting en onderfitting?

Een model met overfitting zorgt voor demasiado van uw verbindingsconjunctuur, inclusief eigenaardigheden en uitschieters die niet worden herhaald. Voer het uitvoeren en valideren van de test uit. Het is een student die de herinneringsreacties opmerkt: sla het simulacro op, maar ga naar het echte examen.

Het onderpassen is het resultaat. Het model kan de structuur van het probleem ondervangen: rinde mal tanto en entrenamiento como en test. Stel je voor dat je een recta-gegevens aanpast die een kromme zijn; por muy bien que la etires, no va a encajar bien. De subaanpassing is een combinatie van alt-sesgo en baja-varianza.

In de praktijk is het een situatie waarin de verschillende verbindingen met elkaar te maken hebben. De grote verschillen tussen de uitvoering en de validatie ervan zijn eenvoudig, het kan zijn dat de resultaten een subjuste-suggestie opleveren. Houd er rekening mee dat u tijdens uw verblijf uw aanvullende pistes opnieuw moet bekijken.

Sesgo en variatie: het evenwicht is heerlijk

Er zijn veel fouten die u kunt maken: sesgo (bias) y varianza (análisis de varianza). Het onderwerp van het model is dat er vermoedens zijn dat het te simpel is (te simpel), wat een ondermaats vertolkt. De variatie onder het model is zeer verstandig en kan gepaard gaan met schommelingen in de concurrentieverhoudingen, waardoor er sprake is van overfitting.

De beroemde afweging sesgo-varianza u bent verplicht een tussenstap te maken. Als de voltooiing toeneemt, kan het zijn dat u de variatie ondergaat; simplificando, gebeurt in tegendeel. In het grote deel van het bedrijfsleven kan het zijn dat de variantie groter wordtAls u wilt waken over het valideren van uw gedrag en niet voor onbepaalde tijd een beslissing wilt nemen.

Snelle voorspelling: levensvoorspelling. Een recta (alt sesgo) kan een corta zijn met een kromme relatie (onderpassend); een graad van 4 die je kunt gebruiken om de ruido op te vangen (alta variant, overfitting); een curva suave de complejidad moderada (door bijvoorbeeld een polinomio de graad 2 bien regularizado) is een groot compromis.

Grafische aanpassing en generalisatie

Dit is een identificeerbaar probleem

De typische tips van het sobreajuste zijn onder meer: Hogere nauwkeurigheid bij het uitvoeren en inferieur zijn tijdens de test; het starten van een bedrijf kan de geldigheidsduur van een bedrijf onder controle houden; uiterste gevoeligheid voor kinderen in de entree; ja wat modellen van meer complete “ganen” in bedrijven die geen algemenere generalisatie mogelijk maken.

Voor de ondergeschikte, gebruik een middelmatige metriek op de volgende punten en op de volgende manier: Er zijn verschillende momenten waarop de punten niet zo groot zijn, het model heeft geen voldoende capaciteit. Andere typische voorbeelden zijn algemene voorspellingen: een classificatie die de burgemeestersklasse prediceert of een regresor die wordt weergegeven in de media.

De validering van de cruzada is voltooid. Una alta variabilidad entre pliegues (plooien) suele apuntar a overfitting. Coherencia en la mediocridad, en cambio, heeft een onderfitting. Dit geldt voor nauwkeurigheid als voorspelfouten (MAE, MSE) of specifieke metrieken op het gebied.

Oorzaken van overfitting

De eerste stap is het voltooien. Modellen met demasiados parametro voor de cantidad en diversidad de beschikbare data tienden een bijzondere locatie. Het beïnvloeden van de tijd tijdens de controle van de tijd: als er geen toepassingen zijn voor de tijd, Het model kan pas een herinnering krijgen.

Andere manieren waarop u de variabelen kunt controleren, zijn: demasiade kenmerken zijn irrelevant of veel correlacionadas empujan al modelo a ver relaciones fantasma. Sommige mensen kunnen een probleem vertegenwoordigen er is geen voldoende variatie como para que el modelo generalice.

Op diepgaande neuronale basis is de grote representatiecapaciteit een wapen van dubbel filodeeg. Omdat het regelmatig en voldoende is, kunnen de redes tien keer eenvoudiger worden gemaakt. Inclusief aspecten als een lotgrootte (batchgrootte) kan grote schade bijdragen aan het onthouden van patrones met een hoge nauwkeurigheid.

Oorzaken van onderfitting

El subajuste suele venir de overmatige modellen zijn eenvoudig om het probleem op te lossen (bijvoorbeeld, lineales sobre relaciones no lineales). Las regularisatie van demasiado fuertes (L1/L2) también pueden “ahogar” el aprendizaje u bent verplicht om buitensporige eenvoudige oplossingen op te lossen.

Andere factoren zijn de verkeerde informatievoorziening tijdens de toegang. Si de kenmerken worden niet herkend op relevante factorenHet model kan niet aan de verwachtingen voldoen. Onvoldoende onvermogen tot normalisering/estandaardisatie Het kan moeilijk zijn om het te optimaliseren en te verhandelen in een periode dat het ondermaats is.

Uiteindelijk moet u het laatste doen als u de tijd niet voldoende vindt (muy pocas épocas o iteraciones), cuando Als u het model terugtrekt, wordt het snel afgebrokenAls de datumgegevens worden overschreden, kunnen de fondbeschermers overmatig worden beschadigd.

Ejemplos cotidianos para entenderlo

Beeld en visie: als u rood bent voor het onthouden van concrete cijfers, je kunt het ondernemerschap en de cijfers van andere manieren begrijpen (overfitting). Con técnicas como gegevensvergroting (rotaciones, volteos) geef de voorkeur aan de generalisatie.

Finanzas: een model van een tijdelijke serie kan nog een keer volgen cambio's die de pas gebruiken, die niet in de toekomst worden herhaald Het is zo dat het goed gaat. Als u te weinig past, kunt u niet reageren op structurele cambios.

Een kleine curiosa van sobreajuste is een robot die de ultieme details van een concreet beton nabootst. De robot is perfect in de veilige veiligheid, maar hij kan deze nieuwe dingen verkopen. Falta generalisatie van de guion.

In de meteorologie is het de bedoeling dat u alleen op een warme temperatuur gaat, wanneer u de druk opmerkt. Deze variabelen kunnen een onderfitting veroorzaken: het modellenmodel van de stad is een aantal jaren geleden dat de termómetro is gebruikt.

Omdat de sobreajuste “peor” kan zijn die de subajuste is

Hay un matiz teórico importante. On modelo subajustado extremo kan een constante blijven, negeer de invoer: uw fout en test rond variant van het variabele doel. In de cambio is een model aangepast dat alle punten van de onderneming kan interpoleren Meestal worden er fouten gemaakt en worden de fouten verschillend en test de forma potentiele descomunale.

Dit kan een vers zijn met alto-grado-polinomieën of inclusief rode MLP-parameters: al het juiste punt is aangepast, “oscilan” tussen observaties Je creëert een absurde waarde van de muziek. Het resultaat is dat de prestatie van het bedrijf afneemt no tiene un tope claro.

Overfitting versus sobreparametrización: geen zoon

Handige verschillende aansluitingen. Overparametrisatie Het betekent dat de klasse van modellen meer capaciteit heeft om de structuur van het probleem te vertegenwoordigen. overfitting kan voorkomen als er een concreet model is, de vormoptimalisaties die een grotere onderneming vormen, kunnen een generalisatie zijn. Met regelmatige regularisatie is het mogelijk dat er een model van parametrisering bestaat dat niet correct is. De reguliere techniek (bijvoorbeeld, rand of lasso) kan een “desacoplar” -concept zijn.

Evalueer en controleer de aanpassing

Verdeel de vloeistof tussendoor, valideer en reinig. Mira-nauwkeurigheid, fouten in de metriek die in elk segment voorkomen. Als u zich aanmeldt, kan dit de validatie zijn, zoals het geval is; Als het eenmaal zo is, is de kans groot dat dit niet lukt.

Het valideren van de kruispunten (k-vouw) vermindert de conclusie van een deel van uw deelname. Als de mediavalidatie wordt ingesteld en de beslissing tussen deze partijen is een baja, er zijn meer garanties voor het algemene model. U kunt een laatste (test)test samen met de evaluatie definiëren U hoeft de hiperparámetros niet aan te passen.

Bovendien heeft let op de distributie van gegevens in de tijd. De gegevensverschuiving (cambios in de distributie van binnenkomst) kan een onleesbaar model worden dat een goede werking heeft: monitor en hernieuw de periode Het is een deel van de receta, geen lujo.

Technieken om overfitting te verminderen

Datos y más datos. Verhoog het volume en de diversiteit van de voeding Ik denk dat het model een beschermheer is van de toevallige details. Dit is het belangrijkste wat de cantidad is: verwijder uitschieters door verstoringen en corrigeer fouten is een prioriteit.

Regularisatie. L1 (lasso) geeft de voorkeur aan de selectie van karakteristiek al llevar pesos a cero; L2 (ridge) geeft de straf weer Het opslaan van peso's is een anularlos. Elastisch net combinaties en veel dingen zijn een middellange termijn.

Arquitectura y entrenamiento. Dropout en redes neuronales apaga-neuronen worden aangetast en geëlimineerd dat het model afhankelijk is van specifieke methoden. En árboles, la poda (snoeien) en beperk de diepte van het aantal hojas recorta la complejidad. Parada temprana: controleer de validatie- en corta-waarde van het grootste deel.

Validación y selección. k-voudige kruisvalidatie om de juiste beslissingen te valideren en het “grotere” model solo door u te laten verdwijnen. Verminder het aantal variabelen Als u meer informatie opneemt, kunt u de variatie en de interpretatie ervan vergroten.

Optimización y lotes. Veel mensen introduceren ruido “saludable” in de gradiënt, wat een menu is, is de generalisatie; Veel gigantische mensen kunnen de voorkeur geven aan het eenvoudigweg optimaliseren van de optimalisatie van het ondernemerspakket.

Technieken om onderfitting te verminderen

Capacidad del modelo. Vul de gegevens in als ze nodig zijn (polinómico in vez de lineal, árboles más profundos, redes menos oppervlakkig). De sleutel is niet langer een frenada en een solide partner.

Regularisatie en tijd. Het is een buitensporige straf, baja de regularisatie om het ademhalingsmodel te verwijderen. Aumenta el numero de pocas: Omdat het model eenvoudigweg meer tijd nodig heeft om te beginnen, u kunt een van de valideringen vinden om niet in de problemen te komen.

Karakteristieken en voorbewerking. Amplía en meer karaktereigenschappen (interacties, beleidstermen, aangepaste codes voor categorieën van variabelen). Normaliza o estandariza omdat het algoritme geen “favoriete” variabelen bevat. In veel gevallen, filterruis eleva la señal útil.

Datos y cobertura. Veel representatieve gegevens verkleinen de waarschijnlijkheid van de onderwaarde. Si el conjunto se queda corto, plantéate overdracht leren een visie op NLP om vertegenwoordigers te vertegenwoordigen en een model te laten zien dat “geen regeling” is.

Gegevenskwaliteit, drift en automatisering

La calidad de datos manda. Exactiteit, volledigheid en consistentie deberiaanse auditarse en crazarse met fiables. Techniek als normalisering (0-1) of estandaardisering (media 0, afwijking 1) Het is onmogelijk om de priemvariabelen in het model te gebruiken door de escalatie.

Met de tijd, de cambian-gegevens. De gegevensverschuiving kan tot overfitting leiden of tot onderfitting in de nieuwe context. De receta: houd de metriek in de gaten, controleer de distributie en voer regelmatig de actuele gegevens uit.

Tools van AutoML kan de selectie van heupparameters, het ingenieuze karakter en de creatie van de evaluatie van pijpleidingen versnellen, waardoor de tijd vrij is om de hele wereld te analyseren. Een historisch punt: de service van Amazon Machine Learning U zult geen nieuwe gewoontes aanvaarden; Als u anti-documentatie gebruikt, kunt u deze presenteren.

Señales clave en reglas de pulgar

In de praktijk van de dia-dia, zijn er veel voorbeelden van: het model is eenvoudig te gebruiken het is eenvoudig dat u de tussenstop moet maken. Met de ervaring die u ervaart, kunt u het volgende doen: grote brecha tussen de test (sobreajuste), resultaten consistente bajos en ambos (subajuste), en varianza tussen de plooien (sobreajuste de manual).

U hoeft zich niet te verzekeren van goede zaken in de onderneming. Een kromme van de geschiedenis die een trein kan leiden tot een validatie is een advies van MEMORIZACIÓN. Als het voorkomt, is het tijd om regelmatig gebruik te maken.

Ensamblados, selectie van kenmerken en lote

De methoden voor het samenvoegen van ayudan. Opzakken (zoals Random Forest) vermindert variatie y suele ser buen antídoto contra el sobreajuste; Boosting (como XGBoost) vermindert sesgo Je kunt eenvoudige modellen van levantar gebruiken, een uniek idee dat je niet sobreajuste bent.

La selectie van kenmerken elimineer variabelen overbodig of irrelevant, lawaai verminderen en de generalisatie is groter. Er is een oplossing die meer effectief is als het probleem groter is dan de invoer.

Sobre el tamaño de lote ya lo insinuamos: Veel mensen introduceren variatie in het verloop van hun menu; Veel mensen kunnen een oplossing bedenken die de toegang tot een test kan doordringen.

Elegir the algoritme: werk sencillo, escala cuando toque

Afhankelijk van het probleem en de gegevens, worden de familieverschillen steeds groter. Als het helder is, kunnen SVM of appels in de maravilla zijn. Met grote en complete combinaties, diepgaande en krachtige combinaties van recente flexibiliteit. Modellen zijn lineair achteruitgegaan door k-NN U kunt uw gegevenssets bescheiden en prima interpreteren.

Een effectieve strategie kan worden vergeleken eenvoudige en complete versies parallel met een esquema van validatie. Er zijn veel mensen die kwetsbaar zijn. Er is geen “meer ingewikkeld” model nodig, het is meer betrouwbaar in de echte wereld.

Gebruikscasussen en consequenties in de onderhandeling

In beide gevallen is een voorspeller van de ziekte meer algemeen dan een ziekenhuis of een specifiek cohort. Zorg ervoor dat de plaatselijke patrones peligroso zijn; subajustar, inútil. En finanzas, modellen die onthoud uw geschiedenis denk dat de handel in toekomstige toekomsten zal plaatsvinden.

Bij autonoom rijdende voertuigen kunnen de detectiesystemen objecten verkennen gevarieerde omgevingen; onthoud de concrete beelden niet. In NLP is het een sentimentanalyse de juiste zinnen gebruiken voor “de carrerilla”, geen nieuwe formuleringen.

Op een nivel de negocio, de sobreajuste da lugar a valse positieven (door bijvoorbeeld fraude) een strategie die pareciaanse promoties en validatie van internationale pero's mogelijk maakt se desploman al desplegarse. El subajuste, por su parte, produce voorspellingen van de tibia's als het om triviale zaken gaat, wordt de zekerheid van de gegevens in beslag genomen.

Preguntas frecuentes en mates practicos

Is het mogelijk dat de selectie van karaktereigenschappen niet eenvoudig is? Al stoppen met ruido en redundantie, verklein de variatie en vergroot de generalisatie. Het is waarschijnlijk dat de eerste stappen irrelevant zijn.

¿Los ensembles verminderen de problemen? Bagging tiende a bajar varianza (menos sobreajuste) y Boosting a bajar sesgo (menos subajuste). Bien ajustados, son herramientas muy potentes.

Waarom zijn de diepzinnige redes met facilitatie mogelijk? Por su enorme capacidad. Regularisatie, uitval en meer gegevens/vergroting het is essentieel dat u eerlijk bent.

¿El tamaño de lote influye? Ja. Veel mensen introduceren veel voordeel wat de voorkeur geeft aan de generalisatie; grote aantallen kunnen “memoriseren” met meer gemak.

¿Transfer learning ayuda? Veel. Dit zijn vertegenwoordigers van de aprendidas U kunt de subaanpassing (effectieve capaciteitsfout) verminderen door het aanpassen van gegevenssets.

Checklist accionable rápido

Als u een praktische opname wilt maken, moet u dat doen gran gap trein/test, piensa en regularisatie, menos complejidad, más data, vroeg stoppen, afvaller, poda en árboles, en valida con k-fold. Zeven mal en train y-test, overweeg meer capaciteit, meer tijd, bajar regularización, de meeste karakteristieken en de juiste voorbereiding (normaal/standaard).

Y no olvides lo operativo: monitoriza drift, planifica reentrenos, cuida la calidad de datos y, si tiene sentido, apóyate en AutoML voor het automatiseren van de onderdelen van de netwerkbus en de evaluatie van pijpleidingen.

Dit is het thema van het evenwicht: houd de tijd vast als u de ruzie voortzet. Als dit evenwicht bestaat, functioneert het model in het laboratorium; als het eenmaal zo is, moet u het doen. Als u de señales detecteert, de geavanceerde technologie toepast en de gegevens opmerkt, is dit merk het verschil tussen “que corre” en “que aporta valor”.

ANOVA met JavaScript
Gerelateerd artikel:
ANOVA met JavaScript: de oorzaak van de herramientas
Gerelateerde berichten: