ANSÖKNINGAR

Hur man tacklar röran med MLOps-verktyg för maskininlärning

Bild: photon_photo/Adobe Stock

Vi har överkomplicerat maskininlärning i flera år. Ibland förväxlar vi det med överskattad artificiell intelligens, och pratar om att ersätta människor med robotresonemang när ML verkligen handlar om att utöka mänsklig intelligens med avancerad mönsterigenkänning. Eller så begraver vi oss i djup inlärning när mer grundläggande SQL-frågor skulle göra jobbet. Men det kanske största problemet med ML idag är hur otroligt komplicerade verktyg vi gör eftersom, som Confetti AI medgrundare Mihail Eric postulerade, ML-verktygslandskapet “med ständigt föränderliga ansvarsområden och nya linjer i sanden är särskilt utmanande för nykomlingar i område”, vilket gör det “en ganska tuff tid att ta dina första steg in i MLOps.”

ATT SE: Etikpolicy för artificiell intelligens (TechRepublic Premium)

Mer måste-läs AI-täckning

Normalt ser vi till verktyg för att göra tekniken enklare. MLOps gör tvärtom. Vad kan göras?

Det är verktyg hela vägen

Problemet, enligt Eric, är att ingen vill lämnas utanför ML Gold Rush. Med tanke på löftet om att lösa problem med miljarder dollar med nästa algoritm, spenderas miljarder dollar på att bygga nya företag. Vart och ett av dessa företag vill sälja en ny modell/funktion/metrik/etc., affär (vilket bara är ett onödigt fint sätt att säga databas). Enligt den nyligen släppta Stanford AI Index-rapporten för 2022 nådde de privata investeringarna i ML (och relaterad AI) 93,5 miljarder dollar 2021, mer än dubbelt så mycket som totalt 2020. , vi ser mer forskning, fler studenter, mer av allt flyter in i ML.

Och fler verktyg. Mycket och mycket mer verktyg.

Längs vägen noterade Eric: “Hela fältet standardiserar fortfarande hur man bäst konstruerar fullfjädrade ML-pipelines. Att uppnå konsensus kring bästa praxis blir lätt en 5-till-10-transformation. år och uppåt.” Under tiden kan du förvänta dig en något skummande och kaotisk miljö för MLOps.

Under tiden, var modig. Även om företag som Google och Amazon (Eric arbetade med Alexa på Amazon) satte tonen för ML:s löfte, “Sanningen är att det bara finns en handfull supersofistikerade företag fokuserade på AI: er med en robust maskininlärningsinfrastruktur på plats för att hantera sina petabyte av data”, påpekade Eric. De flesta av oss är nya inom ML, med andra ord, vad våra LinkedIn-profiler än säger annars.

Eller så kanske “nybörjare” inte är rätt term. Eric beskrev en lång svans av organisationer med “rimligt skalad ML” som kan ha “proprietära datauppsättningar av bra storlek (hundratals gigabyte till terabyte)” men “är fortfarande tidigt i deras ML-antagande”. För dessa företag, fortsatte han, “behöver de inte ens nödvändigtvis dessa ultraavancerade, sub-millisekunders latens, hyperrealtidsdelar av infrastruktur för att börja förbättra sin maskininlärning.”

Än sen då skall gör de för att börja?

Ett steg efter det andra

Enligt Eric är nyckeln att andas djupt och… göra mindre:

  1. Anställ mer erfarna personer för att hjälpa dig överväga alternativ, brainstorma olika tekniker och vara ett bollplank för “dumma” frågor.
  2. Tänk noga på problemet du försöker lösa och den grundläggande metodiken som behövs för att lösa det, snarare än att bli för distraherad av blanka verktyg eller plattformar.
  3. Lägg mycket tid på att bygga riktiga system så att du själv kan se vilka smärtpunkter olika verktyg adresserar.

Det här sista tipset återspeglar ett färskt förslag från Microsofts Scott Hanselman angående mjukvaruutveckling: om du vill förstå programvara bättre bör du “köra riktiga webbplatser och skala dem.” Som Hanselman och Eric föreslår är det i konstruktionen vi möter alla system (och system av system) som fortfarande finns. När det gäller MLOps kommer detta inte att göra det lätt att hantera virrvarret av verktygsalternativ, men den praktiska erfarenheten av att bygga ML-baserade system hjälper till att filtrera signalbrus.

Utöver individuell inlärning är Eric optimistisk att det röriga landskapet med MLOps-verktyg med tiden kommer att ordnas om. Cloud hyperscalers och småföretag som DataRobot, förklarade han, kommer att bygga end-to-end-system som kommer att göra verktyg mer tillgängliga för dem som vill lita på en enda leverantör.

Under tiden kan Erics tre principer hjälpa. På denna andra princip är det värt att komma ihåg något som investeraren David Beyer en gång hävdade: “Den smutsiga hemligheten med maskininlärning … är att så många problem kunde lösas helt enkelt genom att använda enkel analysregression” eller en handfull om/då-påståenden. I tydligare termer: ibland vill vi tillämpa ML på problem som bäst löses med SQL-frågor och “grundläggande matematik”.

Avslöjande: Jag arbetar för MongoDB, men åsikterna som uttrycks här är mina egna.

Botón volver arriba

Ad blocker detected

You must remove the AD BLOCKER to continue using our website THANK YOU