123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118 |
- using HTEXScreen.Service;
- using Microsoft.ML;
- using Microsoft.ML.Data;
- using Microsoft.ML.Trainers;
- using System;
- using static System.Runtime.InteropServices.JavaScript.JSType;
- namespace AML.APP
- {
- internal class Program
- {
- static void Main(string[] args)
- {
- // 时区偏移字符串
- // 时区偏移字符串
- string timeZoneOffsetString = "-08:59";
- bool plus = true;
- if (timeZoneOffsetString.Contains("-"))
- {
- plus=false;
- }
- int timeZoneOffsetHours = 8;
- // 去除时区偏移字符串中的正负号
- timeZoneOffsetString = timeZoneOffsetString.Replace("+", "").Replace("-", "");
- // 尝试解析格式化后的时区偏移字符串
- if (TimeSpan.TryParse(timeZoneOffsetString, out TimeSpan timeZoneOffset))
- {
- // 将时区偏移转换为小时数
- timeZoneOffsetHours = plus ? (int)timeZoneOffset.TotalHours : -(int)timeZoneOffset.TotalHours;
- }
- List<DataPoint> data = new List<DataPoint>();
- // 创建一个新的 ML.NET 环境
- //Random random = new Random();
- //
- //for (int i = 0; i < 500; i++)
- //{
- // data.Add(new DataPoint { Feature = random.Next(1, 1001) });
- //}
- float[] ds= new float[] { 2,1,5,8,7,6,30,35,5,23,78,28,28,30,31,29,21,25,99,101,98,900};
- var datasc= MLService.GetNormalCluster(ds, 5, 0.3);
- foreach (var d in ds) {
- data.Add(new DataPoint { Feature = d });
- }
- // 定义数据视图
- var mlContext = new MLContext();
- var dataView = mlContext.Data.LoadFromEnumerable(data);
- // 定义聚类管道
- var pipeline = mlContext.Transforms.Concatenate("Features", new[] { "Feature" })
- .Append(mlContext.Clustering.Trainers.KMeans(numberOfClusters:3)); // 假设我们想要将数据分成3个集群
- // 训练模型
- var model = pipeline.Fit(dataView);
- // 转换数据以获取聚类结果
- var predictions = model.Transform(dataView);
- // 提取聚类结果
- var inMemoryCollection = mlContext.Data.CreateEnumerable<ClusterPrediction>(predictions, reuseRowObject: false);
- // 打印聚类结果
- //var clusterSizes = new int[3]; // 假设有3个聚类
- int index =0;
- List<ClusterData> clusterDatas = new List<ClusterData>();
- foreach (var prediction in inMemoryCollection)
- {
- //Console.WriteLine($"Data point: {data[index].Feature}, Cluster: {prediction.ClusterId}");
-
- //clusterSizes[prediction.ClusterId-1]++;
- var clusterData= clusterDatas.Find(x => x.ClusterId.Equals(prediction.ClusterId));
- if (clusterData!=null)
- {
- clusterData.count +=1;
- clusterData.datas.Add(data[index].Feature);
- }
- else {
- var datas = new List<float> { data[index].Feature };
- clusterDatas.Add(new ClusterData { count=1, ClusterId=prediction.ClusterId, datas=datas });
- }
- index++;
- }
- // 预测聚类
- // 确定最密集的部分
- // 这通常需要对聚类结果进行分析,比如计算每个聚类的平均距离、大小等
- // 在这里,你可以通过比较不同聚类的数据点数量或计算聚类中心周围的密度来估计哪个是最密集的
- // 示例:计算每个聚类的数据点数量
- // 找出最大的聚类
- //var maxClusterIndex = clusterSizes.ToList().IndexOf(clusterSizes.Max());
- //Console.WriteLine($"The densest cluster is cluster {maxClusterIndex} with {clusterSizes[maxClusterIndex]} data points.");
- // 你还可以进一步分析聚类的特性,比如找出聚类中心、计算聚类内的方差等
- var cluster= clusterDatas.OrderByDescending(x =>x.count).FirstOrDefault();
- }
- }
-
- // 定义数据模型
- public class DataPoint
- {
- public float Feature { get; set; }
- }
- // 聚类预测类
- public class ClusterPrediction
- {
- [ColumnName("PredictedLabel")]
- public uint ClusterId;
- // 你可以添加其他预测列,比如距离聚类中心的距离等
- }
- public class ClusterData {
- public List<float> datas { get; set; } = new List<float>();
- public uint ClusterId { get; set; }
- public int count { get; set; }
- public float avg { get; set; }
- }
- }
|