Présentation
Grâce à SQL, vous pouvez créer, entraîner et gérer des modèles de machine learning directement dans la base de données grâce à l'outil robuste IntegratedML d'InterSystems IRIS. À l'aide d'exemples SQL représentant vos données, nous aborderons dans cet article la configuration d'IntegratedML et son utilisation pratique.
Configuration d'IntegratedML
Une configuration ML (« Configuration ML ») définit le fournisseur de machine learning qui effectuera l'entraînement, ainsi que d'autres informations nécessaires. IntegratedML possède une configuration par défaut appelée %AutoML, déjà activée après l'installation d'InterSystems IRIS.
Création d'une configuration ML
Pour créer une nouvelle configuration ML, nous pouvons utiliser le Portail de gestion du système ou des commandes SQL.
Création d'une configuration ML via SQL
CREATE ML CONFIGURATION MeuMLConfig PROVIDER AutoML USING {'verbosity': 1};
Pour définir cette configuration par défaut :
SET ML CONFIGURATION MeuMLConfig;
Pour afficher les paramètres d'entraînement :
SELECT * FROM INFORMATION_SCHEMA.ML_TRAINING_RUNS;
Application IntegratedML
Création d'un modèle prédictif pour estimer la quantité d'énergie produite par une unité de consommation :
CREATE MODEL PredicaoEnergia PREDICTING (quantidade_generada) FROM UnidadeConsumidora;
Entraînement du modèle :
TRAIN MODEL PredicaoEnergia;
Réalisation de prédictions :
SELECT quanto_generada, PREDICT(PredicaoEnergia) AS predicao FROM UnidadeConsumidora WHERE id = 1001;
Implémentation : Machine Learning dans l'énergie solaire
1. Intégration des données avec IRIS
Nous avons extrait les données essentielles de plusieurs tables pour créer le jeu de données :
SELECT PSID, CHNNLID, TYPENAME, DEVICESN, DEVICETYPE, FACTORYNAME, STATUS FROM datafabric_solar_bd.EQUIPAMENTS;
2. Entraînement du modèle de maintenance prédictive
Utilisation d'Embedded Python sur IRIS pour entraîner un modèle de maintenance prédictive :
from sklearn.ensemble import RandomForestClassifier
from iris import irispy
sql_query = "SELECT PSID, DEVSTATUS, ALARMCOUNT FROM datafabric_solar_bd.USINAS;" data = irispy.sql(sql_query)
model = RandomForestClassifier()
model.fit(data[['DEVSTATUS', 'ALARMCOUNT']], data['PSID'])
3. Prévision de la production énergétique
Utilisation de l'analyse des séries temporelles pour prévoir la production énergétique quotidienne :
from fbprophet import Prophet
df = irispy.sql("SELECT STARTTIMESTAMP, PRODDAYPLANT FROM datafabric_solar_bd.POINTMINUTEDATA;")
df.rename(columns={'STARTTIMESTAMP': 'ds', 'PRODDAYPLANT': 'y'}, inplace=True)
model = Prophet()
model.fit(df)
future = model.make_future_dataframe(periods=30)
forecast = model.predict(future)
4. Identification des zones à fort ensoleillement
L'analyse des données géospatiales permet d'identifier les zones présentant le plus fort potentiel de production d'énergie solaire, optimisant ainsi l'allocation des ressources.
Conclusion
IntegratedML simplifie la mise en œuvre de l'apprentissage automatique dans InterSystems IRIS en permettant l'apprentissage et l'application directe des modèles via SQL. De plus, l'utilisation de techniques d'apprentissage automatique pour la maintenance prédictive et la prévision de la production d'énergie peut contribuer à optimiser le fonctionnement des centrales solaires.